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D.e vorhegende Erfindung betrifft die Verwendung von Promotoren zur Expression 
vorzugsweise zur blutenspezifischen Expression von Genen in Pflanzen der Gattung 
Tagetes, d.e genetisch veranderten Pflanzen der Gattung Tagetes sowie ein Verfahren 
zur Herstellung von biosynthetischen Produkten durch Kultivierung der genetisch ver- 
anderten Pflanzen. 

Verschiedene biosynthetische Produkte. wie beispielsweise Feinchemikalien, wie unter 
anderem Aminosauren, Vitamine, Carotinoide, aber auch Proteine werden Ober nattirli- 
che Stoffwechselprozesse in Zellen hergestellt und werden in vielen Industriezweigen 
verwendet, einschlielSlich der Nahrungsmittel-, Futtermittel-, Kosmetik-, Feed-, Food- 
und pharmazeutischen Industrie. 

Diese Substanzen, die zusammen als Feinchemikalien/Proteine bezeichnet werden 
umfassen unter anderem organische Sauren, sowohl proteinogene als auch nicht- ' 
protemogene Aminosauren, Nukleotide und Nukleoside, Lipide und Fettsauren Diole 
Kohlenhydrate, aromatische Verbindungen, Vitamine, Carotinoide und Cofaktoren 
sow.e Proteine und Enzyme. Ihre Produktion im Groftmaftstab erfolgt zum Teil mitiels 
b.otechnologischer Verfahren unter Verwendung von Mikroorganismen, die entwickelt 
wurden, urn gro&e Mengen der jeweils gewunschten Substanz zu produzieren und 
sezernieren. 

Carotinoide werden de novo in Bakterien, Algen, Pilzen und Pflanzen synthetisiert In 
den letzten Jahren wird zunehmend versucht, auch Pflanzen als Produktionsorganis- 
men fur Feinchemikalien, insbesondere fur Vitamine und Carotinoide zu nutzen. 

Ein naturliches Gemisch aus den Carotinoiden Lutein und Zeaxanthin wird beispiels- 
we.se aus den BlOten von Marigold Pflanzen (Tagetes Pflanzen) als sogenanntes Ole- 
ores.n extrahiert. Diese Oleoresin findet Anwendung sowohl als Inhaltsstoff von Nah- 
rungserganzungsmitteln als auch im Feed-Bereich. 

Lycopin aus Tomaten findet ebenso Anwendung als Nahrungserganzungsmit- 
tel.wahrend Phytoen uberwiegend im kosmetischen Bereich verwendet wird. 

Ketocarotinoide, also Carotinoide, die mindestens eine Keto-Gruppe enthalten wie 
be.sp,elsweise Astaxanthin, Canthaxanthin, Echinenon. 3-Hydroxyechinenon 3- 
Hydroxyechinenon, Adonirubin und Adonixanthin sind naturliche Antioxidantien und 
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Pigmente, die von einigen Algen, Pflanzen und Mikroorganismen als Sekundarmetabo- 
lite produziert werden. 

Aufgrund ihrer farbgebenden Eigenschaften werden die Ketocarotinoide und insbeson- 
dere Astaxanthin als Pigmentierhilfsstoffe in der Tierernahrung, insbesondere in der 
Forellen-, Lachs- und Shrimpszucht verwendet. 

Ein wirtschaftliches biotechnologisches Verfahren zur Herstellung von naturiichen, bio- 
synthetischen Produkten und insbesondere Carotinoiden ist daher von grolier Bedeu- 
tung. 

WO 0032788 beschreibt einige Carotinoid Biosynthesegene aus Pflanzen der Gattung 
Tagetes und offenbart, wie genetisch veranderte Pflanzen der Gattung Tagetes herge- 
stellt werden kdnnten, um in den Petalen verschiedene Carotinoidprofile zu erhalten 
und damit gezielt bestimmte Carotinoide herzustellen. Dazu ist es notig, einige Bio- 
synthesegene uberzuexprimieren und andere zu unterdrDcken. 

Zur Oberexpression der neu gefundenen Carotinoid-Biosynthesgene in Pflanzen der 
Gattung Tagetes wird in WO 0032788 der petalenspezifische Promotor der Ketolase 
aus Adonis vernalis postuliert. 

Aufgrund einer Vielzahl moglicher Schwierigkeiten bei der Oberexpression bestimmter 
Gene besteht ein standiges Bedurfnis, weitere Promotoren zur Verfugung zu stellen, 
die eine Expression von Genen in Pflanzen der Gattung Tagetes ermoglichen. 

Der Erfindung lag daher die Aufgabe zu Grunde, weitere Promotoren zur Verfugung zu 
stellen, die die Expression von Genen in Pflanzen der Gattung Tagetes ermoglichen. 

Demgemaft wurde gefunden, dass sich die Promotoren, ausgewahlt aus der Gruppe 

A) EPSPS Promotor 

B) B-Gene Promotor 

C) PDS Promotor und 

D) CHRC Promotor 

sehr gut zur Expression von Genen in Pflanzen der Gattung Tagetes eignen, mit der 
MalJgabe, dass Gene aus Pflanzen der Gattung Tagetes, die in Wildtyppflanzen der 
Gattung Tagetes von dem jeweiligen Promotor exprimiert werden, ausgenommen sind. 
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Die Erfindung betrifft daher die Verwendung eines Promoters, ausgewahlt aus der 
Gruppe 

A) EPSPS Promotor 
5 B) B-Gene Promotor 

C) PDS Promotor und 

D) CHRC Promotor 

zur Expression von Genen in Pflanzen der Gattung Tagetes, mit der Maftgabe, dass 
10 Gene aus Pflanzen der Gattung Tagetes, die in Wildtyppflanzen der Gattung Tagetes 
von dem jeweiligen Promotor exprimiert werden, ausgenommen sind. 

Benfey et al. (Plant Cell Volume 2, pp. 849-856) beschreiben den EPSPS Promotor 
aus Petunia als petalenspezifischen Promotor zur Expression von Genen in Petunia 
5 hybrida. 

Ronen et al. (PNAS Volume 97, Number 20, 11102-11107 beschreiben den B-GENE 
Promotor aus Tomate als blutenspezifischen Promotor zur Expression von Genen in 
Tomaten. 

20 

Corona et al. (Plant Journal Volume 9 Number 4 pp. 505-512), Mann et al. (Nature Bio- 
technology Volume 18 pp. 888-892) und Rosati et al. (Plant Journal Volume 24 Num- 
ber 3 413-419) beschreiben den PDS Promotor aus Tomate als frucht- und blutenspe- 
zifischen Promotor zur Expression von Genen in Tomaten und Tabak. 

25 

Vishnevetsky et al. (Plant Journal Volume 20 Number 4 pp. 423-431) beschreiben den 
CHRC Promotor aus Gurke als blutenspezifischen Promotor zur Expression von Ge- 
nen in Gurke, und weiteren Pflanzen wie z.B. Nelke, Sonnenblume, Tabak. 

30 Es sind weiterhin zahlreiche blutenspezifische Promotoren aus verschiedenen Orga- 
nismen in der Literatur bekannt. Dabei wurde uberraschend festgestellt, dass viele die- 
ser Promotoren in Pflanzen der Gattung Tagetes nicht zur Expression, insbesondere 
nicht zur blOtenspezifischen oder petalenspezifischen Expression von Genen fOhren. 

35 Es war daher uberraschend, dass sich die Promotoren, ausgewahlt aus der Gruppe 

A) EPSPS Promotor 

B) B-Gene Promotor 
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C) PDS Promotor und 

D) CHRC Promotor 

sehr gut zur Expression, insbesondere zur bIGtenspezifischen und besonderes bevor- 
zugt zur petalenspezifischen Expression von Genen in Pflanzen der Gattung Tagetes 
eignen. 

Unter einem Promotor wird erfindungsgemaft eine Nukleinsaure mit Expressionsaktivi- 
tat verstanden, also eine Nukleinsaure verstanden, die in funktioneller Verknupfung mit 
einer zu exprimierenden Nukleinsaure, im folgenden auch Gen bezeichnet, die Expres- 
sion, also die Transkription und die Translation dieser Nukleinsaure oder dieses Gens 
reguliert. 

Unter „Transkription" wird erfindungsgemaft der Prozess verstanden, durch den aus- 
gehend von einer DNA-Matrize ein komplementares RNA-Molekul hergestellt wird. An 
diesem Prozess sind Proteine wie die RNA-Polymerase, sogenannte Sigma-Faktoren 
und transkriptionelle Regulatorproteine beteiligt. Die synthetisierte RNA dient dann als 
Matrize im Prozess der Translation, der dann zum biosynthetisch aktiven Protein fuhrt. 

Unter einer „funktione!len Verknupfung" versteht man in diesem Zusammenhang bei- 
spielsweise die sequentielle Anordnung einer der erfindungsgemalien Promotoren und 
einer zu exprimierenden Nukleinsauresequenz und ggf. weiterer regulativer Elemente 
wie zum Beispiel einem Terminator derart, dass jedes der reguiativen Elemente seine 
Funktion bei der Expression der Nukleinsauresequenz erfOllen kann. Dazu ist nicht 
unbedingt eine direkte VerknQpfung im chemischen Sinne erforderlich. Genetische 
Kontrollsequenzen, wie zum Beispiel Enhancer-Sequenzen, konnen ihre Funktion auch 
von weiter entfernten Positionen oder gar von anderen DNA-Molekulen aus auf die 
Zielsequenz ausuben. Bevorzugt sind Anordnungen, in denen die zu exprimierende 
Nukleinsauresequenz oder das zu exprimierende Gen hinter (d.h. am 3'-Ende) der er- 
findungsgema&en Promotorsequenz positioniert wird, so dass beide Sequenzen kova- 
lent miteinander verbunden sind. Bevorzugt ist dabei der Abstand zwischen der Promo- 
torsequenz und der zu exprimierende Nukleinsauresequenz geringer als 200 Basen- 
paare, besonders bevorzugt kleiner als 100 Basenpaare, ganz besonders bevorzugt 
kleiner als 50 Basenpaare. 

Unter „Expressionsaktivitat" wird erfindungsgemaB die in einer bestimmten Zeit durch 
den Promoter gebildete Menge Protein, also die Expressionsrate, verstanden. 
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Unter ..spezifischer Expressionsaktivitat" wird erfindungsgemaft die in einer bestimmten 
Zeit durch den Promotor gebildete Menge Protein pro Promotor verstanden. 

Bei einer ..verursachten Expressionsaktivitat" Oder „verursachten Expressionsrate" im 
Bezug auf ein Gen im Vergleich zum Wildtyp wird somit im Vergleich zum Wildtyp die 
Bildung eines Proteins verursacht, das im Wildtyp so nicht vorhanden war. 

Bei einer „erh6hten Expressionsaktivitat" oder .erhohten Expressionsrate" im Bezug 
auf em Gen im Vergleich zum Wildtyp wird somit im Vergleich zum Wildtyp in einer 
bestimmten Zeit die gebildete Menge des Proteins erhoht. 

Die Bildungsrate, mit der ein biosynthetsich aktives Protein hergestellt wird, ist ein Pro- 
dukt aus der Rate der Transkription und der Translation. Beide Raten konnen erfin- 
dungsgemali beeinflusst werden und damit die Rate der Bildung von Produkten in ei- 
nem Mikroorganismus beeinflussen. 

Die Bezeichnung „dass Gene aus Pflanzen der Gattung Tagetes, die in Wildtyppflan- 
zen der Gattung Tagetes von dem Jeweiligen" Promotor exprimiert werden, ausge- 
nommen sind", bedeutet, dass beispielsweise der EPSPS Promotor aus Pflanzen der 
Gattuung Tagetes nicht zur Expression von EPSPS-Genen aus Pflanzen der Gattuung 
Tagetes verwendet wird. Dahingegen kann das EPSPS-Gen aus Pflanzen der Gattung 
Tagetes erfindungsgemafc durch einen B-Gene Promotor, PDS Promotor oder CHRC 
Promotor aus Pflanzen der Gattung Tagetes eprimiert werden. 

Unter dem Begriff "Wildtyp" oder „Wildtyppflanze" wird erfindungsgemaft die entspre- 
chende Ausgangspflanze der Gattung Tagetes verstanden. 

Je nach Zusammenhang kann unter dem Begriff "Pflanze" die Ausgangspflanze (Wild- 
typ) oder eine erfindungsgemaUe, genetisch veranderte Pflanze der Gattung Tagetes 
oder beides verstanden werden. 

Vorzugsweise wird unter "Wildtyp" fur die Erhohung oder Verursachung der Expressi- 
onsaktivitat oder Expressionsrate und fur die Erhohung des Gehalts an biosyntheti- 
schen Produkten die Pflanze Tagetes erecta, insbesondere die Pflanze Tagetes erecta 
Hybrid 50011 (WO 02012438) als Referenzorganismus verstanden. 

Unter einem „EPSPS Promotor werden Promotoren verstanden, die natQrlicherweise 
in Organismen, vorzugsweise in Pflanzen, die Genexpression einer Nukleinsaure, ko- 
dierend eine 5-Enolpyruvylshikimat-3-phosphatsynthase, regulieren, sowie von diesen 
Promotorsequenzen durch Substitution, Insertion oder Deletion von Nukleotiden oder 
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durch Fragmentierung dieser Promotorsequenzen ableitbare Nukleinsauresequenzen 
die noch diese Expressionsaktivitat aufweisen und somit funktionelle Aquivalente dar- 
stellen. 

Diese EPSPS Promotorsequenzen aus anderen Organismen, insbesondere Pflanzen 
als den nachstehend angegebenen Promotorsequenzen lassen sich insbesondere 
durch Homologievergleiche in Datenbanken oder Hybridisierungsstudien mit DNA- 
B.biiotheken verschiedener Organismen unter Verwendung der nachstehend beschrie- 
benen EPSPS Promotorsequenzen oder den Nukleinsauren, kodierend eine 5- 
Enolpyruvylshikimat-3-phosphatsynthase, auffinden. 

Vorzugsweise werden dazu die Nukleinsauren, kodierend eine 5-Enolpyruvylshikimat- 
3-phosphatsynthase, verwendet, da in der kodierenden Sequenz konservierte Bereiche 
haufiger sind als in der Promotorsequenz. 

Unter einer 5-Enolpyruvylshikimat-3-phosphatsynthase wird ein Protein verstanden 
das die enzymatische Aktivitat aufweist, Shikimat-3-Phosphat in 5-Enolpyruvylshikimat- 
3-Phosphat umzuwandeln. 

Bevorzugte EPSPS Promotoren enthalten 

A1) die Nukleinsauresequenz SEQ. ID. NO. 1, 2 oder 3 oder 
A2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 
auf Nukleinsaureebene mit der jeweiligen Sequenz SEQ. ID. NO. 1, 2 oder 
3 aufweist oder 

A3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

1 , 2 oder 3 unter stringenten Bedingungen hybridisiert oder 
A4) funktionell aquivalente Fragmente der Sequenzen unter A1), A2) oder A3) 



Die Nukleinsauresequenz SEQ. ID. NO. 1 stellt eine Promotorsequenz der 5- 
Enolpyruvylshikimat-3-phosphatsynthase (EPSPS) aus Petunia hybrida (AAH19653) 

Die Nukleinsauresequenz SEQ. ID. NO. 2 stellt eine Promotorsequenz der 5- 
Enolpyruvylshikimat-3-phosphatsynthase (EPSPS) aus Petunia hybrida (M37029) dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 3 stellt eine weitere Promotorsequenz der 5- 
Enolpyruvylshikimat-3-phosphatsynthase (EPSPS) aus Petunia hybrida dar. 
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Die Erfindung betrifft weiterhin EPSPS Promotoren, enthaltend eine von diesen Se- 
quenzen (SEQ. ID. NO. 1, 2 oder 3) durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % auf Nuklein- 
saureebene mit der jeweiligen Sequenz SEQ. ID. NO. 1,2 oder 3 aufweist. 

Weitere natOrliche erfindungsgemafte Beispiele fQr erfindungsgemafte EPSPS 
Promotoren lassen sich beispielsweise aus verschiedenen Organismen, deren 
genomische Sequenz bekannt ist, durch Identitatsvergleiche der 
Nukleinsauresequenzen aus Datenbanken mit den vorstehend beschriebenen 
Sequenzen SEQ ID NO: 1, 2 oder 3 leicht aufflnden. 

KOnstliche erfindungsgemafie EPSPS Promotor-Sequenzen lassen sich ausgehend 
von den Sequenzen SEQ ID NO: 1, 2 oder 3 durch kQnstliche Variation und Mutation 
be.sp.elsweise durch Substitution, Insertion oder Deletion von Nukleotiden leicht auf-' 
finden. 

Diefolgenden Definition und Bedingungen der Identitatsvergleiche und Hybridisie- 
rungsbed.ngungen gelten fur alle Nukleinsauren, also alle Promotoren und Gene der 
Beschreibung. 

Unter dem Begriff "Substitution" ist der Austausch einer oder mehrerer Nukleotide 
durch e.n oder mehrere Nukleotide zu verstehen. .Deletion" ist das Ersetzen eines 
Nukleot.des durch eine direkte Bindung. Insertionen sind Einfugungen von Nukleotiden 
in d.e Nukle.nsauresequenz, wobei formal eine direkte Bindung durch ein oder mehrere 
Nukleotide ersetzt wird. 

Unter Identitat zwischen zwei Nukleinsauren wird die Identitat der Nukleotide Qber die 
jewe.ls gesamte Nukleinsaurelange verstanden, insbesondere die Identitat die durch 
Vergle.ch mit Hilfe der Vector NTI Suite 7.1 Software der Rrma Informax (USA) unter 
Anwendung der Clustal Methode (Higgins DG, Sharp PM. Fast and sensitive multiple 
sequence alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2): 151-1) 
unter Einstellung folgender Parameter berechnet wird: 

Multiple alignment parameter- 
Gap opening penalty 10 
Gap extension penalty 10 
Gap separation penalty range 8 
Gap separation penalty off 
% identity for alignment delay 40 
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Residue specific gaps off 
Hydrophilic residue gap off 
Transition weighing 0 



Pairwise alignment parameter: 
FAST algorithm on 
K-tuplesize 1 
Gap penalty 3 
Window size 5 
Number of best diagonals 5 



Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 1 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 1, ins- 
besondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine Identi- 
tat von mindestens 60 % aufweist. 



Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 2 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 2, ins- 
besondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine Identi- 
tat von mindestens 60 % aufweist. 



Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 3 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 3, ins- 
besondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine Identi- 
tat von mindestens 60 % aufweist. 

Besonders bevorzugte EPSPS Promotoren weisen mit der jeweiligen Nukleinsaurese- 
quenz SEQ. ID. NO. 1, 2 oder 3 eine Identitat von mindestens 70%, bevotzugter min- 
destens 80%, mindestens 90%, mindestens 92%, mindestens 95%, mindestens 96%, 
mindestens 97%, mindestens 98%, besonders bevorzugt mindestens 99% auf. 

Weitere natQrliche Beispiele fur EPSPS Promotoren lassen sich weiterhin ausgehend 
von den vorstehend beschriebenen Nukleinsauresequenzen, insbesondere ausgehend 
von den Sequenzen SEQ ID NO: 1, 2 oder 3, aus verschiedenen Organismen, deren 
genomische Sequenz nicht bekannt ist, durch Hybridisierungstechniken in an sich be- 
kannter Weise leicht auffinden. 
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Ein weiterer Gegenstand der Erfindung betriffl daher EPSPS Promotoren, enthaltend 
eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. No. 1, 2 oder 3 
unter stringenten Bedingungen hybridisiert. Diese Nukleinsauresequenz umfasst min- 
destens 10, bevorzugter mehr als 12,15,30,50 oder besonders bevorzugt mehr als 150 
Nukleotide. 

Unter "hybridisieren" versteht man die Fahigkeit eines Poly- oder Oligonukleotids, unter 
stringenten Bedingungen an eine nahezu komplementare Sequenz zu binden, wahrend 
unter diesen Bedingungen unspezifische Bindungen zwischen nicht-komplementaren 
Partnern unterbleiben. Dazu sollten die Sequenzen vorzugsweise zu 90-100% kom- 
plementar sein. Die Eigenschaft komplementarer Sequenzen, spezifisch aneinander 
binden zu konnen, macht man sich beispielsweise in der Northern- oder Southern-Blot- 
Technik oder bei der Primerbindung in PCR oder RT-PCR zunutze. 

Die Hybridisierung erfolgt erfinungsgemafi unter stringenten Bedingungen. Solche 
Hybridisierungsbedingungen sind beispielsweise bei Sambrook, J., Fritsch, E.F., Mani- 
atis, T., in: Molecular Cloning (A Laboratory Manual), 2. Auflage, Cold Spring Harbor 
Laboratory Press, 1989, Seiten 9.31-9.57 oder in Current Protocols in Molecular Biolo- 
gy, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6 beschrieben: 

Unter stringenten Hybridisierungs-Bedingungen werden insbesondere verstanden: 
Die Qber Nacht Inkubation bei 42°C in einer L6sung bestehend aus 50 % Formamid, 5 
x SSC (750 mM NaCI, 75 mM Tri-Natrium Citrat), 50 mM Natrium Phosphat (ph7,6),'5x 
Denhardt Losung, 10% Dextransulfat und 20 g/ml denaturierte, gescheerte 
Lachsspermien-DNA, gefolgt von einem Waschen der Filter mit 0,1x SSC bei 65°C. 

Unter einem „funktionell aquivalenten Fragment" werden fur Promotoren Fragmente 
verstanden die im wesentlichen die gleiche Promotoraktivitat aufweisen wie die Aus- 
gangssequenz. 

Unter „im wesentlichen gleich" wird eine spezifische Expressionsaktivitat verstanden 
die mindestens 50% i vorzugsweise 60%, bevorzugter 70%, bevorzugter 80%, bevor- 
zugter 90%, besonders bevorzugt 95% der spezifischen Expressionsaktivitat der Aus- 
gangssequenz aufweist. 

Unter ..Fragmente" werden Teilsequenzen der durch Ausfuhrungsform A1), A2) oder 
A3) beschriebenen EPSPS Promotoren verstanden. Vorzusgweise weisen diese 
Fragmente mehr als 10, bevorzugter aber mehr als 12,15, 30, 50 oder besonders be- 
vorzugt mehr als 150 zusammenhangende Nukleotide der Nukleinsauresequenz SEQ. 
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ID. NO. 1, 2oder3auf. 

Besonders bevorzugt ist die Verwendung der Nukleinsauresequenz SEQ. ID. NO. 1, 2 
oder 3 als EPSPS Promotor, d.h. zur Expression von Genen in Pflanzen der Gattung 
5 Tagetes. 

Alle vorstehend erwahnten EPSPS Promotoren sind weiterhin in an sich bekannter 
Weise durch chemische Synthese aus den Nukleotidbausteinen wie beispielsweise 
durch Fragmentkondensation einzelner uberlappender, komplementarer Nukleinsaure- 
10 bausteine der Doppelhelix herstellbar. Die chemische Synthese von Oligonukleotiden 
kann beispielsweise, in bekannter Weise, nach der Phosphoamiditmethode (Voet, 
Voet, 2. Auflage, Wiley Press New York, S. 896-897) erfolgen. Die Anlagerung synthe- 
tischer Oligonukleotide und Auffullen von Lucken mithilfe des Klenow-Fragmentes der 
DNA-Polymerase und Ligationsreaktionen sowie allgemeine Klonierungsverfahren 

•15 werden in Sambrook et al. (1989), Molecular cloning: A laboratory manual, Cold Spring 
f Harbor Laboratory Press, beschrieben. 

Unter einem „B-Gene Promotor" werden Promotoren verstanden, die naturlicherweise 
in Organismen, vorzugsweise in Pflanzen, die Genexpression einer Nukleinsaure, ko- 
20 dierend eine Lycopin-p-Cyclase, insbesondere eine chromoplastenspezifische Lycopin- 
P-Cyclase, regulieren, sowie von diesen Promotorsequenzen durch Substitution, Inser- 
tion oder Deletion von Nukleotiden oder durch Fragmentierung dieser Promotorse- 
quenzen ableitbare Nukleinsauresequenzen, die noch diese Expressionsaktivitat auf- 
weisen und somit funktionelle Aquivalente darstellen. 

25 

Diese B-Gene Promotorsequenzen aus anderen Organismen, insbesondere Pflanzen, 
als den nachstehend angegebenen Promotorsequenzen lassen sich insbesondere 
durch Homologievergleiche in Datenbanken oder Hybridisierungsstudien mit DNA- 

• ( Bibliotheken verschiedener Organismen unter Verwendung der nachstehend beschrie- 
30 benen B-Gene Promotorsequenzen oder den Nukleinsauren, kodierend eine Lycopin- 
P-Cyclase, auffinden. 

Vorzugsweise werden dazu die Nukleinsauren, kodierend eine Lycopin-p-Cyclase, 
verwendet, da in der kodierenden Sequenz konservierte Bereiche haufiger sind als in 
35 der Promotorsequenz. 

Unter einer Lycopin-p-Cyclase wird ein Protein verstanden, das die enzymatische Akti- 
vitat aufweist, Lycopin in y-Carotin und/oder p-Carotin umzuwandeln. 
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Bevorzugte B-Gene Promotoren enthalten 

B1) die Nukleinsauresequenz SEQ. ID. NO. 4, 5 oder 6 oder 
B2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 
auf Nukleinsaureebene mit der jeweiligen Sequenz SEQ. ID. NO. 4, 5 oder 
6 aufweist oder 

B3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

4, 5 oder 6 unter stringenten Bedingungen hybridisiert oder 
B4) funktionell aquivalente Fragmente der Sequenzen unter B1), B2) oder B3) 

Die Nukleinsauresequenz SEQ. ID. NO. 4 stellt eine Promotorsequenz der chro- 
moplastenspezifischen Lycopin-p-Cyclase (B-Gene) aus Lycopersicon esculentum 
(AAZ51517)dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 5 stellt eine Promotorsequenz der chro- 
moplastenspezifischen Lycopin-p-Cyclase (B-Gene) aus Lycopersicon esculentum 
(AAZ51521) dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 6 stellt eine weitere Promotorsequenz der 

chromoplastenspezifischen Lycopin-p-Cyclase (B-Gene) aus Lycopersicon esculentum 
dar. 

Die Erfindung betrifft weiterhin B-Gene Promotoren, enthaltend eine von diesen Se- 
quenzen (SEQ. ID. NO. 4, 5 oder 6) durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % auf Nuklein- 
saureebene mit der jeweiligen Sequenz SEQ. ID. NO. 4, 5 oder 6 aufweist. 

Weitere naturliche erfindungsgemalJe Beispiele fDr erfindungsgemalJe B-Gene 
Promotoren lassen sich beispielsweise aus verschiedenen Organismen, deren 
genomische Sequenz bekannt ist, durch Identitatsvergleiche der 
Nukleinsauresequenzen aus Datenbanken mit den vorstehend beschriebenen 
Sequenzen SEQ ID NO: 4, 5 oder 6 leicht auffinden. 

KQnstliche erfindungsgemalJe B-Gene Promotor-Sequenzen lassen sich ausgehend 
von den Sequenzen SEQ ID NO: 4, 5 oder 6 durch kunstliche Variation und Mutation, 
beispielsweise durch Substitution, Insertion oder Deletion von Nukleotiden leicht auf- 
finden. 
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Unter einer Nukleinsauresequenz, die eine Identity von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 4 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 4, ins- 
besondere nach obigen Programmlogarithmus mit obigem Parametersatz eine Identitat 
von mindestens 60 % aufweist. 

Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 5 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 5, ins- 
besondere nach obigen Programmlogarithmus mit obigem Parametersatz eine Identitat 
von mindestens 60 % aufweist. 

Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 6 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 6, ins- 
besondere nach obigen Programmlogarithmus mit obigem Parametersatz eine Identitat 
von mindestens 60 % aufweist. 

Besonders bevorzugte B-Gene Promotoren weisen mit der jeweiligen Nukleinsaurese- 
quenz SEQ. ID. NO. 4, 5 oder 6 eine Identitat von mindestens 70%, bevorzugter min- 
destens 80%, mindestens 90%, mindestens 92%, mindestens 95%, mindestens 96%, 
mindestens 97%, mindestens 98%, besonders bevorzugt mindestens 99% auf. 

Weitere natQrliche Beispiele fur B-Gene Promotoren lassen sich weiterhin ausgehend 
von den vorstehend beschriebenen Nukleinsauresequenzen, insbesondere ausgehend 
von den Sequenzen SEQ ID NO: 4, 5 oder 6 aus verschiedenen Organismen, deren 
genomische Sequenz nicht bekannt ist, durch Hybridisierungstechniken in an sich be- 
kannter Weise leicht auffinden. 

Ein weiterer Gegenstand der Erfindung betrifft daher B-Gene Promotoren, enthaltend 
eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. No. 4, 5 oder 6 
unter stringenten Bedingungen hybridisiert. Diese Nukleinsauresequenz umfasst min- 
destens 10, bevorzugter mehr als 12,15,30,50 oder besonders bevorzugt mehr als 150 
Nukleotide. 

Die Hybridisierungbedingungen sind vorstehend beschrieben. 

Unter einem „funktionell aquivalenten Fragment" werden fur Promotoren Fragmente 
verstanden, die im wesentlichen die gleiche Promotoraktivitat aufweisen wie die Aus- 
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gangssequenz. 

Unter „im wesentlichen gleich" wird eine spezifische Expressionsaktivitat verstan- 
den.die mindestens 50%, vorzugsweise 60%, bevorzugter 70%, bevorzugter 80%, be- 
vorzugter 90%, besonders bevorzugt 95% der spezifischen Expressionsaktivitat der 
Ausgangssequenz aufweist. 

Unter M Fragmente w werden Teilsequenzen der durch Ausfuhrungsform B1), B2) Oder 
B3) beschriebenen B-Gene Promotoren verstanden. Vorzusgweise weisen diese 
Fragmente mehr als 10, bevorzugter aber mehr als 12,15, 30, 50 Oder besonders be- 
vorzugts mehr als 150 zusammenhangende Nukleotide der Nukleinsauresequenz 
SEQ. ID. NO. 4, 5 Oder 6 auf. 

Besonders bevorzugt ist die Verwendung der Nukleinsauresequenz SEQ. ID. NO. 4, 5 
oder 6 als B-Gene Promotor, d.h. zur Expression von Genen in Pflanzen der Gattung 
Tagetes. 

Alle vorstehend erwahnten B-Gene Promotoren sind weiterhin in an sich bekannter 
Weise durch chemische Synthese aus den Nukleotidbausteinen wie beispielsweise 
durch Fragmentkondensation einzelner uberlappender, komplementarer Nukleinsaure- 
bausteine der Doppelhelix herstellbar. Die chemische Synthese von Oligonukleotiden 
kann beispielsweise, in bekannter Weise, nach der Phosphoamiditmethode (Vbet, 
Voet, 2. Aufiage, Wiley Press New York, S. 896-897) erfolgen. Die Anlagerung synthe- 
tischer Oligonukleotide und Auffullen von Lucken mithilfe des Klenow-Fragmentes der 
DNA-Polymerase und Ligationsreaktionen sowie allgemeine Klonierungsverfahren 
werden in Sambrook et al. (1989), Molecular cloning: A laboratory manual, Cold Spring 
Harbor Laboratory Press, beschrieben, 

Unter einem „PDS Promoto^ werden Promotoren verstanden, die naturlicherweise in 
Organismen, vorzugsweise in Pflanzen, die Genexpression einer Nukleinsaure, kodie- 
rend eine Phytoendesaturase, regulieren, sowie von diesen Promotorsequenzen durch 
Substitution, Insertion oder Deletion von Nukleotiden oder durch Fragmentierung die- 
ser Promotorsequenzen ableitbare Nukleinsauresequenzen, die noch diese Expressi- 
onsaktivitat aufweisen und somit funktionelle Aquivalente darstellen. 

Diese PDS Promotorsequenzen aus anderen Organismen, insbesondere Pflanzen, als 
den nachstehend angegebenen Promotorsequenzen lassen sich insbesondere durch 
Homologievergleiche in Datenbanken oder Hybridisierungsstudien mit DNA- 
Bibliotheken verschiedener Organismen unter Verwendung der nachstehend beschrie- 
benen PDS Promotorsequenzen oder den Nukleinsauren, kodierend eine Phytoende- 
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saturase, auffinden. 

Vorzugsweise werden dazu die Nukleinsauren, kodierend eine Phytoendesaturase, 
verwendet, da in der kodierenden Sequenz konservierte Bereiche haufiger sind als in 
der Promotorsequenz. 

Unter einer Phytoendesaturase wird vorzugsweise ein Protein verstanden, das die en- 
zymatische Aktivitat aufweist, Phytoen in Phytofluen umzuwandeln. 

Bevorzugte PDS Promotoren enthalten 

C1) die Nukleinsauresequenz SEQ. ID. NO. 7, 8, 9 oder 10 oder 

C2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 

Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 

auf NukleinsSureebene mit der jeweiligen Sequenz SEQ. ID. NO. 7, 8, 9 

oder 10 aufweist oder 
C3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

7, 8, 9 oder 10 unter stringenten Bedingungen hybridisiert oder 
C4) funktionell aquivalente Fragmente der Sequenzen unter C1), C2) oder C3) 

Die Nukleinsauresequenz SEQ. ID. NO. 7 stellt eine Promotorsequenz der Phytoende- 
saturase (PDS) aus Lycopersicon esculentum (U46919) dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 8 stellt eine Promotorsequenz der Phytoende- 
saturase (PDS) aus Lycopersicon esculentum (X78271) dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 9 stellt eine Promotorsequenz der Phytoende- 
saturase (PDS) aus Lycopersicon esculentum (X171023) dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 10 stellt eine weitere Promotorsequenz der 
Phytoendesaturase (PDS) aus Lycopersicon esculentum dar. 

Die Erfindung betrifft weiterhin PDS Promotoren, enthaltend eine von diesen Sequen- 
zen (SEQ. ID. NO. 7, 8, 9 oder 10) durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % auf Nuklein- 
saureebene mit der jeweiligen Sequenz SEQ. ID. NO. 7, 8, 9 oder 10 aufweist. 

Weitere naturliche erfindungsgemafte Beispiele fOr erfindungsgemalie PDS Promoto- 
ren lassen sich beispielsweise aus verschiedenen Organismen, deren genomische 
Sequenz bekannt ist, durch Identitatsvergleiche der Nukleinsauresequenzen aus Da- 
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tenbanken mit den vorstehend beschriebenen Sequenzen SEQ ID NO: 7, 8, 9 oder 10 
leicht auffinden. 



Kiinstliche erfindungsgemalie PDS Promotor-Sequenzen lassen sich ausgehend von 
5 den Sequenzen SEQ ID NO: 7, 8, 9 oder 10 durch kunstliche Variation und Mutation, 
beispielsweise durch Substitution, Insertion oder Deletion von Nukleotiden leicht auf- 
finden. 



Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
10 quenz SEQ ID NO: 7 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 7, ins- 
besondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine Identi- 
tat von mindestens 60 % aufweist. 

|J5 Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
f quenz SEQ ID NO: 8 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 8, ins- 
besondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine Identi- 
tat von mindestens 60 % aufweist. 

20 

Unter einer Nukleinsauresequenz, die eine identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 9 aufweist, wird dementsprechend eine Nukleinsauresequenz ver- 
standen, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 9, ins- 
besondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine Identi- 
25 tat von mindestens 60 % aufweist. 

Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 10 aufweist, wird dementsprechend eine Nukleinsauresequenz 
verstanden, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 10, 
30 insbesondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine I- 
dentitat von mindestens 60 % aufweist. 

Besonders bevorzugte PDS Promotoren weisen mit der jeweiligen Nukleinsaurese- 
quenz SEQ. ID. NO. 7, 8, 9 oder 10 eine Identitat von mindestens 70%, bevorzugter 
35 mindestens 80%, mindestens 90%, mindestens 92%, mindestens 95%, mindestens 
96%, mindestens 97%, mindestens 98%, besonders bevorzugt mindestens 99% auf. 

Weitere natOrliche Beispiele fur PDS Promotoren lassen sich weiterhin ausgehend von 
den vorstehend beschriebenen Nukleinsauresequenzen, insbesondere ausgehend von 
40 den Sequenzen SEQ ID NO: 7, 8, 9 oder 10 aus verschiedenen Organismen, deren 
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genomische Sequenz nicht bekannt ist, durch Hybridisierungstechniken in an sich be- 
kannter Weise leicht auffinden. 

Ein weiterer Gegenstand der Erfindung betrifft daher PDS Promotoren, enthaltend eine 
5 Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. No. 7, 8, 9 oder 10 
unter stringenten Bedingungen hybridisiert. Diese Nukleinsauresequenz umfasst min- 
destens 10, bevorzugter mehr als 12,15,30,50 oder besonders bevorzugt mehr als 150 
Nukleotide. 

10 Die Hybridisierungbedingungen sind vorstehend beschrieben. 

Unter einem Junktionell aquivalenten Fragment" werden fur Promotoren Fragmente 
verstanden, die im wesentlichen die gleiche Promotoraktivitat aufweisen wie die Aus- 
gangssequenz. 



Unter „im wesentlichen gleich" wird eine spezifische Expressionsaktivitat verstanden, 
die mindestens 50%, vorzugsweise 60%, bevorzugter 70%, bevorzugter 80%, bevor- 
zugter 90%, besonders bevorzugt 95% der spezifischen Expressionsaktivitat der Aus- 
gangssequenz aufweist 



Unter „Fragmente" werden Teilsequenzen der durch AusfQhrungsform C1), C2) oder 
C3) beschriebenen PDS Promotoren verstanden. Vorzusgweise weisen diese Frag- 
mente mehr als 10, bevorzugter aber mehr als 12,15, 30, 50 oder besonders bevor- 
zugts mehr als 150 zusammenhangende Nukleotide der Nukleinsauresequenz SEQ. 
25 ID. NO. 7, 8, 9 oder 10 auf. 

Besonders bevorzugt ist die Verwendung der Nukleinsauresequenz SEQ. ID. NO. 7, 8, 
9 oder 10 als PDS Promoter, d.h. zur Expression von Genen in Pflanzen der Gattung 
Tagetes. 



Alle vorstehend erwahnten PDS Promotoren sind weiterhin in an sich bekannter Weise 
durch chemische Synthese aus den Nukleotidbausteinen wie beispielsweise durch 
Fragmentkondensation einzelner uberlappender, komplementarer Nukleinsaurebau- 
steine der Doppelhelix herstellbar. Die chemische Synthese von Oligonukleotiden kann 

35 beispielsweise, in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. 
Auflage, Wiley Press New York, S. 896-897) erfolgeri. Die Anlagerung synthetischer 
Oligonukleotide und Auffullen von Lucken mithilfe des Klenow-Fragmentes der DNA- 
Polymerase und Ljgationsreaktionen sowie allgemeine Klonierungsverfahren werden in 
Sambrook et al. (1989), Molecular cloning: A laboratory manual, Cold Spring Harbor 

40 Laboratory Press, beschrieben. 




20 
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Unter einem „CHRC Promotor" werden Promotoren verstanden, die naturlicherweise in 
Organismen, vorzugsweise in Pflanzen, die Genexpression einer Nukleinsaure, kodie- 
rend ein Chromoplasten-assoziiertes Protein C regulieren, sowie von diesen Promotor- 
sequenzen durch Substitution, Insertion oder Deletion von Nukleotiden oder durch 
Fragmentierung dieser Promotorsequenzen ableitbare Nukleinsauresequenzen, die 
noch diese Expressionsaktivitat aufweisen und somit funktionelle Aquivalente darstel- 
len. 

Diese CHRC Promotorsequenzen aus anderen Organismen, insbesondere Pflanzen, 
als den nachstehend angegebenen Promotorsequenzen lassen sich insbesondere 
durch Homologievergleiche in Datenbanken oder Hybridisierungsstudien mit DNA- 
Bibliotheken verschiedener Organismen unter Verwendung der nachstehend beschrie- 
benen CHRC Promotorsequenzen oder den Nukleinsauren kodierend ein Chro- 
moplasten-assoziiertes Protein C auffinden. 

Vorzugsweise werden dazu die Nukleinsauren kodierend ein Chromoplasten- 
assoziiertes Protein C verwendet, da in der kodierenden Sequenz konservierte Berei- 
che haufiger sind als in der Promotorsequenz. 

Bevorzugte CHRC Promotoren enthalten 

D1) die Nukleinsauresequenz SEQ. ID. NO. 11, 12, 13 oder 14 oder 

D2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 

Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 

auf Nukleinsaureebene mit der jeweiligen Sequenz SEQ. ID. NO. 11, 12, 

13 oder 14 aufweist oder 
D3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

11, 12, 13 oder 14 unter stringenten Bedingungen hybridisiert oder 
D4) funktionell aquivalente Fragmente der Sequenzen unter D1), D2) oder D3) 

Die Nukleinsauresequenz SEQ. ID. NO. 11 stellt eine Promotorsequenz des Chro- 
moplasten-assoziiertes Protein C (CHRC) aus Gurke (AAV36416) dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 12 stellt eine weitere Promotorsequenz des 
Chromoplasten-assoziiertes Protein C (CHRC) aus Gurke dar. 

Die Nukleinsauresequenz SEQ. ID. NO. 13 stellt eine weitere Promotorsequenz des 
Chromoplasten-assoziiertes Protein C (CHRC) aus Gurke dar. 
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Die Nukleinsauresequenz SEQ. ID. NO. 14 steilteine weitere Promotorsequenz des 
chromoplasten assoziiertes Protein C (CHRC) aus Gurke dar. 

Die Erfindung betrifft weiterhin CHRC Promotoren, enthaltend eine von diesen Se- 
5 quenzen (SEQ. ID. NO. 11, 12, 13, Oder 14) durch Substitution, Insertion Oder Deletion 
von Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % auf Nuk- 
leinsSureebene mit der jeweiligen Sequenz SEQ. ID. NO. 11, 12, 13, oder 14 aufweist. 

Weitere naturliche erfindungsgemafte Beispiele fUr erfindungsgemafte CHRC Promoto- 
10 ren lassen sich beispielsweise aus verschiedenen Organismen, deren genomische 
Sequenz bekannt ist, durch Identitatsvergleiche der Nukleinsauresequenzen aus Da- 
tenbanken mit den vorstehend beschriebenen Sequenzen SEQ ID NO: 11, 12, 13, oder 
14 leicht auffinden. 

•5 Kunstliche erfindungsgemafie CHRC Promotor-Sequenzen lassen sich ausgehend von 
den Sequenzen SEQ ID NO: 11, 12, 13, oder 14 durch kOnstliche Variation und Mutati- 
on, beispielsweise durch Substitution, Insertion oder Deletion von Nukleotiden leicht 
auffinden. 

20 Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 1 1 aufweist, wird dementsprechend eine Nukleinsauresequenz 
verstanden, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 11, 
insbesondere nach obigen Programmlogarithmus mit obigem Parametersatz eine Iden- 
titat von mindestens 60 % aufweist. 

25 

Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 12 aufweist, wird dementsprechend eine Nukleinsauresequenz 
verstanden, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 12, 

• insbesondere nach obigen Programmlogarithmus mit obigem Parametersatz eine Iden- 
30 titat von mindestens 60 % aufweist. 

Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 13 aufweist, wird dementsprechend eine Nukleinsauresequenz 
verstanden, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 13, 
35 insbesondere nach obigen Programmlogarithmus mit obigem Parametersatz eine Iden- 
titat von mindestens 60 % aufweist. 

Unter einer Nukleinsauresequenz, die eine Identitat von mindestens 60 % mit der Se- 
quenz SEQ ID NO: 14 aufweist, wird dementsprechend eine Nukleinsauresequenz 
40 verstanden, die bei einem Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 14, 
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insbesondere nach obigen Programmlogarithmus, mit obigem Parametersatz eine I- 
dentitat von mindestens 60 % aufweist. 

Besonders bevorzugte CHRC Promotoren weisen mit der jeweiligen Nukleinsaurese- 
5 quenz SEQ. ID. NO. .11, 12, 13, oder 14 eine Identitat von mindestens 70%, bevorzug- 
ter mindestens 80%, mindestens 90%, mindestens 92%, mindestens 95%, mindestens 
96%, mindestens 97%, mindestens 98%, besonders bevorzugt mindestens 99% auf. 

Weitere natOrliche Beispiele fur CHRC Promotoren lassen sich weiterhin ausgehend 
1 0 von den vorstehend beschriebenen Nukleinsauresequenzen, insbesondere ausgehend 
von den Sequenzen SEQ ID NO: 11, 12, 13, oder 14 aus verschiedenen Organismen, 
deren genomische Sequenz nicht bekannt ist, durch Hybridisierungstechniken in an 
sich bekannter Weise leicht auffinden. 

• 5 Ein weiterer Gegenstand der Erfindung betrifft daher CHCRC Promotoren, enthaltend 
eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. No. 11, 12, 13, 
oder 14 unter stringenten Bedingungen hybridisiert. Diese Nukleinsauresequenz um- 
fasst mindestens 10, bevorzugter mehr als'12, 15,30,50 oder besonders bevorzugt 
mehr als 150 Nukleotide. 

20 

Die Hybridisierungbedingungen sind vorstehend beschrieben. 

Unter einem „funktionell aquivalenten Fragment" werden fur Promotoren Fragmente 
verstanden, die im wesentlichen die gleiche Promotoraktivitat aufweisen wie die Aus- 
25 gangssequenz. 

Unter „im wesentlichen gleich" wird eine spezifische Expressionsaktivitat verstanden, 

• die mindestens 50%, vorzugsweise 60%, bevorzugter 70%, bevorzugter 80%, bevor- 
zugter 90%, besonders bevorzugt 95% der spezifischen Expressionsaktivitat der Aus- 
30 gangssequenz aufweist. 

Unter „Fragmente" werden Teilsequenzen der durch Ausfuhrungsform D1), D2) oder 
D3) beschriebenen CHRC Promotoren verstanden. Vorzusgweise weisen diese Frag- 
mente mehr als 10, bevorzugter aber mehr als 12,15, 30, 50 oder besonders bevor- 
35 zugts mehr als 1 50 zusammenhangende Nukleotide der Nukleinsauresequenz SEQ. 
ID. NO. 11, 12, 13, oder 14 auf. 

Besonders bevorzugt ist die Verwendung der Nukleinsauresequenz SEQ. ID. NO. 11, 
12, 13, oder 14 als CHRC Promotor, d.h. zur Expression von Genen in Pflanzen der 
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Gattung Tagetes. 

Alle vorstehend erwahnten CHRC Promotoren sind weiterhin in an sich bekannter Wei- 
se durch chemische Synthese aus den Nukleotidbausteinen wie beispielsweise durch 

5 Fragmentkondensation einzelner uberlappender, komplementarer Nukleinsaurebau- 
steine der Doppelhelix herstellbar. Die chemische Synthese von Oligonukleotiden kann 
beispielsweise, in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. 
Auflage, Wiley Press New York, S. 896-897) erfolgen. Die Anlagerung synthetischer 
Oligonukleotide und Auffullen von Lucken mithilfe des Klenow-Fragmentes der DNA- 

10 Polymerase und Ligationsreaktionen sowie allgemeine Klonierungsverfahren werden in 
Sambrook et al. (1989), Molecular cloning: Alaboratory manual, Cold Spring Harbor 
Laboratory Press, beschrieben. 

Mit den erfindungsgemafien Promotoren lasst sich prinzipiell jedes Gen, also jede Nuk- 

•15 leinsaure, kodierend ein Protein, in Pflanzen der Gattung Tagetes exprimieren, insbe- 
f sondere bliitenspezifisch exprimieren, besonders bevorzugt petalenspezifisch expri- 
mieren. 

Diese in Pflanzen der Gattung Tagetes zu exprimierenden Gene werden im folgenden 
20 auch „Effektgene" genannt. 

Bevorzugte Effektgene sind beispielsweise Gene aus dem Biosynthesweg von Ge- 
ruchsstoffen und Bliitenfarben, deren Expression oder erhdhte Expression in Pflanzen 
der Gattung Tagetes zu einer Vearnderung der Geruchs und/oder der Blutenfarbe von 
25 Bluten der Pflanzen der Gattung Tagetes fuhrt. 

Die Biosynthese von fliichtigen Geruchskomponenten, speziell in Bluten, wurde in den 
letzten Jahren an verschiedenen Modellorganismen wie Clarkia breweri und Antirhinum 

• majus L. studiert, Fluchtige Geruchskomponenten werden beispielsweise innerhalb des 
30 Monoterpen- und Phenylpropan-Stoffwechsels gebildet werden. Im ersten Fall handelt 
es sich um Linalool; von den Phenylpropanen sind Methyleneugenol, Benzylacetat, 
Methylbenzoat und Methylsalicat abgeleitet. 

FQr die Biosynthese von Linalool, (ISo)Methyleigenol, Benzylacetat und Methylsalicinat 
35 sind bevorzugte Gene ausgewahlz aus der Gruppe Nukleinsauren kodierend eine Lina- 
looI-Synthase (LIS), Nukleinsauren kodierend eine S-Adenosyl-L-Met:(iso)-Eugenol-0- 
Methyltransferase (IEMT), Nukleinsauren kodierend eine Acetyl-CoA-Benzylalkohol- 
Acetyltransferase und Nukleinsauren kodierend eine S-Adenosy!-L-Met:Salicylsaure- 
Methyltransferase (SAMT). Nukleinsaurensequenzen und Proteinsequenzen zu den 
40 genannten enzymatischen Aktivitaten sind in Dudareva et al. Plant Cell 8 (1996), 1 137- 
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1 148; Wang et al. Plant Physiol. 1 14 (1997), 213-221 und Dudareva et at. Plant J 14 
(1998) 297-304) beschrieben. 

Besonders bevorzugte Effektgene sind Gene aus Biosyntheswegen von biosyntheti- 
schen Produkten die in Pflanzen der Gattung Tagetes naturlicherweise, d.h. im Wildtyp 
oder durch genetische Veranderung des Wildtyps hergestellt werden konnen, insbe- 
sondere in BIQten hergestellt werden kOnnen, besonders bevorzugt in Petalen herge- 
stellt werden konnen. 

Bevorzugte biosynthetische Produkte sind Feinchemikalien. 

Der Begriff "Feinchemikalie" ist im Fachgebiet bekannt und beinhaltet Verbidnungen 
die von e.nem Organismus produziert werden und in verschiedenen Industriezweigen 
Anwendungen finden, wie bspw.. jedoch nicht beschrankt auf die pharmazeutische 
Industrie, die Landwirtschafts-, Kosmetik , Food und Feed-Industrie. Diese Verbindun- 
gen umfassen organische Sauren, wie beispielsweise Weinsaure, Itaconsaure und 
D.am.nopimelinsaure, sowohl proteinogene als auch nicht-proteinogene Aminosauren 
Punn- und Pyrimidinbasen, Nukleoside und Nukleotide (wie bspw. beschrieben in Ku-' 
n.naka, A. (1996) Nucleotides and related compounds, S. 561-612, in Biotechnology 
Bd. 6, Rehm et al., Hrsg. VCH: Weinheim und den darin enthaltenen Zitaten) Lipide 
gesatt.gte und ungesattigte Fettsauren (bspw. Arachidonsaure), Diole (bspw Propan- 
d.ol und Butandiol), Kohlenhydrate (bspw. Hyaluronsaure und Trehalose), aromatische 
Verbindungen (bspw. aromatische Amine, Vanillin und Indigo), Vitamine, Carotinoide 
und Cofaktoren (wie beschrieben in Ullmann's Encyclopedia of Industrial Chemistry 
Bd. A27, "Vitamins", S. 443-613 (1996) VCH: Weinheim und den darin enthaltenen ' 
Z.taten; und Ong, AS., Niki, E. und Packer, L. (1995) "Nutrition, Lipids, Health and 
Disease" Proceedings of the UNESCO/Confederation of Scientific and Technological 
Associations in Malaysia and the Society for Free Radical Research - Asien 
abgehalten am 1.-3. Sept. 1994 in Penang, Malysia, AOCS Press (1995)) Enzyme und 
samtliche anderen von Gutcho (1983) in Chemicals by Fermentation, Noyes Data Cor- 
poration, ISBN: 0818805086 und den darin angegebenen Literaturstellen. beschriebe- 
nen Chemikalien). Der Metabolismus und die Verwendungen bestimmter Feinchemika- 
lien sind nachstehend weiter erlautert. 

I. AminosSure-Metabolismus und Verwendungen 

Die Aminosauren umfassen die grundlegenden Struktureinheiten samtlicher Proteine 
und sind somit fur die normalen Zellfunktionen essentiell. Der Begriff "Aminosaure" ist 
.m Fachgebiet bekannt. Die proteinogenen Aminosauren, von denen es 20 Arten gibt 
d.enen als Struktureinheiten fOr Proteine, in denen sie uber Peptidbindungen miteinan- 
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der verknupft sind, wohingegen die nicht-proteinogenen Aminosauren (von denen 
Hunderte bekannt sind) gewohnlich nicht in Proteinen vorkommen (siehe Ullmann's 
Encyclopedia of Industrial Chemistry, Bd. A2, S. 57-97 VCH: Weinheim (1985)) Die 
Am.nosauren konnen in der D- oder L-Konfiguration vorliegen. obwohl L-Aminosauren 
gewohnl.ch der einzige Typ sind, den man in naturlich vorkommenden Proteinen vor- 
findet. B.osynthese- und Abbauwege von jeder der 20 proteinogenen Aminosauren 
«nd I sowohl bei prokaryotischen als auch eukaryotischen Zellen gut charakterisiert 
(s.ehe bspw. Stryer, L. Biochemistry, 3. Auflage, S. 578-590 (1988)). Die "essentiellen" 
Am.nosauren (Histidin, Isoleucin, Leucin, Lysin, Methionin, Phenylaianin, Threonin, 
Tryptophan und Valin), so bezeichnet, da sie aufgrund der Komplexitat ihrer Biosyn- 
these m.t der Ernahrung aufgenommen werden mQssen, werden durch einfache Bio- 
syntheseswege in die ubrigen 11 "nichtessentiellen" Aminosauren (Alanin, Arginin 
Asparagm, Aspartat, Cystein, Glutamat, Glutamin, Glycin, Prolin, Serin und Tyrosin) 
umgewandelt. Hohere Tiere besitzen die Fahigkeit, einige dieser Aminosauren zu syn- 
thehsieren, jedoch mQssen die essentiellen Aminosauren mit der Nahrung aufgenom- 
men werden, damit eine normale Proteinsynthese stattfindet. 

Abgesehen von ihrer Funktion bei der Proteinbiosynthese sind diese Aminosauren inte- 
ressante Chem.kalien an sich, und man hat entdeckt, daB viele bei verschiedenen An- 
wendungen in der Nahrungsmittel-, Putter-, Chemie-, Kosmetik-, Landwirtschafts- und 
pharmazeut,schen Industrie zum Einsatz kommen. Lysin ist nicht nur fOr die Ernahrung 
des Menschen eine wichtige Aminosaure, sondem auch fur monogastrische Tiere, wie 
Geflugel und Schweine. Glutamat wird am hauflgsten als Geschmacksadditiv (Mono- 
natnumglutamat, MSG) sowie weithin in der Nahrungsmittelindustrie verwendet wie 
auch Aspartat, Phenylaianin, Glycin und Cystein. Glycin, L-Methionin und Tryptophan 
werden samtlich in der pharmazeutischen Industrie verwendet. Glutamin, Valin, Leucin 
soleucn. H.stidin, Arginin, Prolin, Serin und Alanin werden in der pharmazeutischen ' 
Industrie und der Kosmetikindustrie verwendet. Threonin, Tryptophan und D-/L- 
Memionin sind weitverbreitete Futtermittelzusatze (Leuchtenberger, W. (1996) Amino 
adds - techn.ca. production and use, S. 466-502 in Rehm et a.., (Hrsg.) Biotechnology 
Bd^ 6, Kap,te. 14a, VCH: Weinheim). Man hat entdeckt, dali sich diese Aminosauren 
aulierdem als Vorstufen fur die Synthese von synthetischen Aminosauren und Protei- 
nen, w,e N-Acetylcystein, S-Carboxymethyl-L-cystein, (S)-5-Hydroxytryptophan und 
anderen, .n Ullmann's Encyclopedia of Industrial Chemistry, Bd. A2, S. 57-97 VCH 
Weinheim, 1985 beschriebenen Substanzen eignen. 

Die Biosynthese dieser natQrlichen Aminosauren in Organismen, die sie produzieren 
konnen. bspw. Bakterien, ist gut charakterisiert worden (fur einen Oberblick der bakte- 
nellen Aminosaure-Biosynthese und ihrer Regulation, s. Umbarger, H.E. (1978) Ann 
Rev. Biochem. 47: 533 - 606). Glutamat wird durch reduktive Aminierung von a- 
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em Z T Chenpr0dukt im Citronensaure-Zyklus, synthetisiert. Glutamin, 
Prohn und Arg.n.n werden jeweils nacheinander aus Glutamat erzeugt. Die Biosynthe- 
se von Senn erfolgt in einem Dreischritt-Verfahren und beginnt mit 3-Phosphog.ycerat 

mnTundH rr Uk K I" G,yk0,ySe) ' ^ er9ibt naCh ° Xidations -' Transaminie- 
rungs- und Hydrolyseschntten diese Aminosaure. Cystein und Glycin werden jeweils 

aus Senn produziert, und zwar die erstere durch Kondensation von Homocystein mit 
Senn und die letztere durch Obertragung des Seitenketten- P -Kohlenstoffatoms auf 
Tetrahydrofolat, in einer durch Serintranshydroxymethylase katalysierten Reaktion 
Phenylalan.n und Tyrosin werden aus den Vorstufen des Glycolyse- und Pento- ' 
sephosphatweges, Erythrose-4-phosphat und Phosphoenolpyruvat in einem 9-Schritt- 
B,osyntheseweg synthetisiert, der sich nur in den ietzten beiden Schntten nach der 
Synthese von Prephenat unterscheidet. Tryptophan wird ebenfalls aus diesen beiden 
Ausgangsmolekulen produziert, jedoch erfolgt dessen Synthese in einem 11-Schritt- 
Weg. Tyrosm lafct sich in einer durch Phenylalaninhydroxylase katalysierten Reaktion 
auch aus Phenyla.anin herste.len. Alanin, Valin und Leucin sind jewei.s Biosynthese- 
produkte aus Pyruvat, dem Endprodukt der G.ykolyse. Aspartat wird aus Oxalacetat 
e,nem Zwischenprodukt des Citratzyklus, gebildet. Asparagin, Methionin, Threonin und 
Lys.n werden jeweils durch Umwandlung von Aspartat produziert. Iso.eucin wird aus 

luTsThn^h k k ° mP,eXen 9 " Schritt " We 9 erf °'9tdie Bildung von Histidin 

aus 5-Phosphor.bosyM-pyrophosphat, einem aktivierten Zucker. 

Aminosauren, deren Mengeden Proteinbiosynthesebedarf der Zel.e Qbersteigt, konnen 

teflT^ Ch " en ' ^ W6rden StattdeSSen ab9ebaUt ' S ° daB Zwischenproduk 
te fur d,e Haupt-Stoffwechselwege der Zel.e bereitgeste.lt werden (fur einen Oberb.ick 
siehe Stryer, L., Biochemistry, 3. Aufl. Kap. 21 "Amino Acid Degradation and the Urea 
Cycle"; S 495-516 (1988)). Die Zelle ist zwar in der Lege, ungewOnschte Aminos^ 
"fj S^echsel-Zwischenprodukte umzuwandeln, jedoch ist die Aminosaure- 
produkfon h.ns,cht.ich der Energie, der Vorstufenmolekule und der fOr ihre Synthese 
notigen Enzyme aufwendig. Es Uberrascht daher nicht, dafJ die Aminosaure- 
Biosynthese durch Feedback-Hemmung reguliert wird, wobei das Vorliegen einer be- 
sttmmten Aminosaure ihre eigene Produktion verlangsamt oder ganz beendet (fur ei- 
nen Uberbhck Qber den RQckkopplungs-Mechanismus bei Aminosaure- 
aosynthesewegen, siehe Stryer, L, Biochemistry, 3. Aufl., Kap. 24, "Biosynthesis of 
Ammo Acids and Heme", S. 575-600 (1988)). Der Ausstofi einer bestimmten Amino- 
saure w.rd daher durch die Menge dieser Aminosaure in der Zelle eingeschrankt 

II. Vitamine, Carotinoide, Cofaktoren und NutrazeutikaMetabolismus sowie Ve/wen- 
dungen rwww 
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Vitamine, Carotinoide, Cofaktoren und Nutrazeutika umfassen eine weitere Gruppe von 
Molekulen. Hdhere Tiere haben die Fahigkeit verloren, diese zu synthetisieren und 
mussen sie somit aufnehmen, obwohl sie leicht durch andere Organismen, wie Bakte- 
rien, synthetisiert werden. Diese Molekule sind entweder biologisch aktive Molekule an 
sich Oder Vorstufen von biologisch aktiven Substanzen, die als Elektronentrager oder 
Zwischenprodukte bei einer Reihe von Stoffwechselwegen dienen. Diese Verbindun- 
gen haben neben ihrem Nahrwert auch einen signifikanten industriellen Wert als Farb- 
stoffe, Antioxidantien und Katalysatoren oder andere Verarbeitungs-Hilfsstoffe. (Fur 
einen Oberblick Qber die Struktur, Aktivitat und die industriellen Anwendungen dieser 
Verbindungen siehe bspw. Ullmann's Encyclopedia of Industrial Chemistry, "Vitamins", 
Bd. A27, S. 443-613, VCH: Weinheim, 1996). Der Begriff "Vitamin" ist im Fachgebiet 
bekannt und umfaBt Nahrstoffe, die von einem Organismus fur eine normale Funktion 
benotigt werden, jedoch nicht von diesem Organismus selbst synthetisiert werden kon- 
nen. Die Gruppe der Vitamine kann Cofaktoren und nutrazeutische Verbindungen um- 
fassen. Der Begriff "Cofaktor" umfaftt nicht-proteinartige Verbindungen, die fur das Auf- 
treten einer normalen Enzymaktivitat n6tig sind. Diese Verbindungen konnen organisch 
oder anorganisch sein; die erfindungsgemalien Cofaktor-Molekiile sind vorzugsweise 
organisch. Der Begriff "Nutrazeutikum" umfafct Nahrungsmittelzusatze, die bei Pflanzen 
und Tieren, insbesondere dem Menschen, gesundheitsfordernd sind. Beispiele solcher 
Molekule sind Vitamine, Antioxidantien und ebenfalls bestimmte Lipide (z.B. mehrfach 
unges§ttigte Fettsauren). 

Bevorzugte Feinchemikalien oder biosynthetische Produkte, die in Pflanzen der Gat- 
tung Tagetes, insbesondere in Petalen der Bluten der Pflanzen der Gattung Tagetes 
hergestellt werden k6nnen, sind Carotinoide, wie beispielsweise Phytoen, Lycopin, 
Lutein, Zeaxanthin, Astaxanthin, Canthaxanthin, Echinenon, 3-Hydroxyechinenon, 3'- 
Hydroxyechinenon, Adonirubin, Violaxanthin und Adonixanthin. 

Besonders bevorzugte Carotinoide sind Ketocarotinoide, wie beispielsweise Asta- 
xanthin, Canthaxanthin, Echinenon, 3-Hydroxyechinenon, 3'-Hydroxyechinenon, Adoni- 
rubin, Violaxanthin und Adonixanthin. 

Die Biosynthese dieser Molekule in Organismen, die zu ihrer Produktion befahigt sind, 
wie Bakterien, ist umfassend charakterisiert worden (Ullmann's Encyclopedia of Indus- 
trial Chemistry, "Vitamins", Bd. A27, S. 443-613, VCH: Weinheim, 1996, Michal, G. 
(1999) Biochemical Pathways: An Atlas of Biochemistry and Molecular Biology, John 
Wiley & Sons; Ong, AS., Niki, E. und Packer, L. (1995) "Nutrition, Lipids, Health and 
Disease" Proceedings of the UNESCO/Confederation of Scientific and Technological 
Associations in Malaysia and the Society for free Radical Research - Asien, abgehalten 
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am 1.-3. Sept. 1994 in Penang, Malaysia, AOCS Press, Champaign, IL X, 374 S). 

Thiamin (Vitamin B l} wird durch chemisches Kuppeln von Pyrimidin und Thiazol- 
E-nherten gebildet. Riboflavin (Vitamin B 2 ) wird aus Guanosin-5'-triphosphat (GTP) und 
R.bose-5 -phosphat synthetisiert. Riboflavin wiederum wird zur Synthese von Flavin- 
mononukleotid (FMN) und Flavinadenindinukleotid (FAD) eingesetzt. Die Familie von 
Verb.ndungen, die gemeinsam als 'Vitamin B6" bezeichnet werden (bspw. Pyridoxin 
Pyndoxamin, Pyridoxal-5'-phosphat und das kommerziell verwendete Pyridoxin- ' 
hydrochlorid), sind alle Derivate der gemeinsamen Struktureinheit 5-Hydroxy-6- 
methylpyridin. Panthothenat (Pantothensaure, R-(H-)-N-(2,4-Dihydroxy-3,3-dimethyl-1- 
oxobuty.)-p-alanin) kann entweder durch chemische Synthese Oder durch Fermentation 
hergeste.it werden. Die letzten Schritte bei der Pantothenat-Biosynthese bestehen aus 
der ATP-getnebenen Kondensation von p-Alanin und Pantoinsaure. Die fur die Biosyn- 
theseschntte fur die Umwandlung in Pantoinsaure, in p-Alanin und zur Kondensation in 
Pantothensaure verantwortlichen Enzyme sind bekannt. Die metabolisch aktive Form 
von Pantothenat ist Coenzym A, dessen Biosynthese Qber 5 enzymatische Schritte 
verlauft. Pantothenat, Pyridoxal-5'-phosphat, Cystein und ATP sind die Vorstufen von 
Coenzym A. Diese Enzyme katalysieren nicht nur die Bildung von Pantothenat. son- 
dern auch die Produktion von (R)-Pantoinsaure, (R)-Pantolacton, (R)-Pantheno. (Provi- 
tamin B 5 ), Pantethein (und seinen Derivaten) und Coenzym A. 

Die Biosynthese von Biotin aus dem VorstufenmolekQI Pimeloyl-CoA in Mikroorganis- 
men .st ausfQhrlich untersucht worden, und man hat mehrere der beteiligten Gene i- 
dent.fiz.ert. Es hat sich herausgestellt, dalJ viele der entsprechenden Proteine an der 
Fe-Cluster-Synthese beteiligt sind und zu der Klasse der nifS-Proteine gehoren Die 
bponsaure wird von der Octanonsaure abgeleitet und dient als Coenzym beim Ener- 
g.e-Metabol.smus, wo sie Bestandteil des Pyruvatdehydrogenasekomplexes und des 
a-Ketoglutaratdehydrogenasekomplexes wird. Die Folate sind eine Gruppe von Sub- 
stanzen, die alle von der Folsaure abgeleitet werden, die wiederum von L- 
Glutammsaure, p-Aminobenzoesaure und 6-Methylpterin hergeleitet ist. Die Biosynthe- 
se der Folsaure und ihrer Derivate, ausgehend von den metabolischen Stoffwechsel- 
zwschenprodukten Guanosin-S'-triphosphat (GTP). L-Glutaminsaure und p- 
Ammobenzoesaure ist in bestimmten Mikroorganismen eingehend untersucht worden. 

Corrinoide (wie die Cobalamine und insbesondere Vitamin B 12 ) und die Porphyrine 
gehoren zu einer Gruppe von Chemikalien, die sich durch ein Tetrapyrrol-Ringsystem 
ausze.chnen. Die Biosynthese von Vitamin B 12 ist hinreichend komplex, daB sie noch 
n,cht vollstand,g charakterisiert worden ist, jedoch ist inzwischen ein GroBteil der betei- 
hgten Enzyme und Substrate bekannt. Nikotinsaure (Nikotinat) und Nikotinamid sind 
Pynd.n-Der.vate, die auch als "Niacin" bezeichnet werden. Niacin ist die Vorstufe der 
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wichtigen Coenzyme NAD (Nikotinamidadenindinukleotid) und NADP (Nikotinamidade- 
nindinukleotidphosphat) und ihrer reduzierten Formen. 

Die Produktion dieser Verbindungen im GrolimafJstab beruht grolitenteils auf zellfreien 
chemischen Synthesen, obwohl einige dieser Chemikalien ebenfalls durch gro&ange- 
legte Anzucht von Mikroorganismen produziert worden sind, wie Riboflavin, Vitamin B 6 , 
Pantothenat und Biotin. Nur Vitamin B 12 wird aufgrund der Komplexitat seiner Synthese 
lediglich durch Fermentation produziert. In-vitro-Verfahren erfordern einen erheblichen 
Aufwand an Materialien und Zeit und haufig an hohen Kosten. 

III. Purin-, Pyrimidin-, Nukleosid- und Nukleotid-Metabolismus und Verwendungen 

Gene fur den Purin- und Pyrimidin-Stoffwechsel und ihre entsprechenden Proteine sind 
wichtige Ziele fQr die Therapie von Tumorerkrankungen und Virusinfektionen. Der Beg- 
riff "Purin" Oder "Pyrimidin" umfaftt stickstoffhaltige Basen, die Bestandteil der Nuklein- 
sauren, Coenzyme und Nukleotide sind. Der Begriff "Nukleotid" beinhaltet die grundle- 
genden Struktureinheiten der NukleinsauremolekQIe, die eine stickstoffhaltige Base, 
einen Pentose-Zucker (bei RNA ist der Zucker Ribose, bei DNA ist der Zucker D- 
Desoxyribose) und Phosphorsaure umfassen. Der Begriff "Nukleosid" umfalit MolekQIe, 
die als Vorstufen von Nukleotiden dienen, die aber im Gegensatz zu den Nukleotiden 
keine Phosphorsaureeinheit aufweisen. Durch Hemmen der Biosynthese dieser Mole- 
kQIe oder ihrer Mobilisation zur Bildung von NukleinsauremolekGlen ist es moglich, die 
RNA- und DNA-Synthese zu hemmen; wird diese Aktivitat zielgerichtet bei kanzeroge- 
nen Zellen gehemmt, lalit sich die Teilungs- und Replikations-Fahigkeit von Tumorzel- 
len hemmen. 



Es gibt zudem Nukleotide, die keine NukleinsauremolekQIe bilden, jedoch als Energie- 
speicher (d.h. AMP) oder als Coenzyme (d.h. FAD und NAD) dienen. 

Mehrere Veroffentlichungen haben die Verwendung dieser Chemikalien fur diese me- 
dizinischen Indikationen beschrieben, wobei der Purin- und/oder Pyrimidin- 
Metabolismus beeinflulit wird (bspw. Christopherson, R.I. und Lyons, S.D. (1990) "Po- 
tent inhibitors of de novo pyrimidine and purine biosynthesis as chemotherapeutic a- 
gents", Med. Res. Reviews 10: 505-548). Untersuchungen an Enzymen, die am Purin- 
und Pyrimidin-Metabolismus beteiligt sind, haben sich auf die Entwicklung neuer Medi- 
kamente konzentriert, die bspw. als Immunsuppressionsmittel oder Antiproliferantien 
verwendet werden konnen (Smith, J.L. "Enzymes in Nucleotide Synthesis" Curr. Opin. 
Struct. Biol. 5 (1995) 752-757; Biochem. Soc. Transact. 23 (1995) 877-902). Die Purin- 
und Pyrimidlnbasen, Nukleoside und Nukleotide haben jedoch auch andere Einsatz- 
moglichkeiten: als Zwischenprodukte bei der Biosysnthese verschiedener 
Feinchemikalien (z.B. Thiamin, S-Adenosyl-methionin, Folate oder Riboflavin), als 
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kalten (z.B Th.amin, S-Adenosyl-methionin, Folate oder Riboflavin), als Energietrager 
fur die Zelle (bspw. ATP oder GTP) und fur Chemikalien selbst, werden gew6hnlich als 
Geschmacksverstarker verwendet (bspw. IMP oder GMP) oder fur viele medizinische 
Anwendungen (siehe bspw. Kuninaka, A., (1996) "Nucleotides and Related Com- 
pounds in Biotechnology Bd. 6, Rehm et al., Hrsg. VCH: Weinheim, S. 561-612) En- 
zyme, d,e am Purin-, Pyrimidin-, Nukleosid- oder Nukleotid-Metabolismus beteiligt sind 
dienen auch immer starker als Ziele, gegen die Chemikalien fur den Pflanzenschutz ' 
e.nschl.eftlich Fungiziden, Herbiziden und Insektiziden entwickelt werden. 

Der Metabolismus dieser Verbindungen in Bakterien ist charakterisiert worden (fur U- 
bersichten siehe bspw. Zalkin, H. und Dixon. J.E. (1992) »De novo purin nucleotide 
b.osynthes.s in Progress in Nucleic Acids Research and Molecular biology Bd 42 
Academic Press, S. 259-287; und Michal, G. (1999) "Nucleotides and Nucleosides"' 
Kap. 8 in : Biochemical Pathways: An Atlas of Biochemistry and Molecular Biology, ' 
W,ley, New York). Der Purin-Metabolismus, das Objekt intesiver Forschung, ist fur das 
normale Funktionieren der Zelle essentiell. Ein gestorter Purin-Metabolismus in hohe- 
wl? re K "OT 6 Erkrankun 9 en verursachen, bspw. Gicht. Die Purinnukleotide 
^ e ' ne 6 SChfitten ° ber die Zw '^henverbindung lnosin-5'-phosphat 
(IMP) aus R.bose-5-phosphat synthetisiert, was zur Produktion von Guanosin-5"- 
monophosphat (GMP) oder Adenosin-5'-monophosphat (AMP) fuhrt, aus denen sich 
die als Nukleot.de verwendeten Triphosphatformen leicht herstellen lassen. Diese Ver- 
bindungen werden auch als Energiespeicher verwendet, so daft ihr Abbau Energie fur 
viele versch.edene biochemische Prozesse in der Zelle Hefert. Die Pyrimidinbiosynthe- 
se erfolgt uber die Bildung von Undin-S'-monophosphat (UMP) aus Ribose-5-phosphat 
UMPw^derum wird in Cytidin-5'-triphosphat (CTP) umgewandelt. Die DesoxyVormen 
samtlicher Nukleotide werden in einer Einschritt-Reduktionsreaktion aus der 
Diphosphat-Riboseform des Nukleotides zur Diphosphat-Desoxyriboseform des Nukle- 
otides hergestellt. Nach der Phosphorylierung kQnnen diese Molekule an der DNA- 
Synthese teilnehmen. 

IV. Trehalose-Metabolismus und Verwendungen 

Trehalose besteht aus zwei GlucosemolekOlen, die Qber a,a-1,1-Bindung miteinander 
ve^rknupft s.nd. Sie wird gewohnlich in der Nahrungsmittelindustrie als SQIXstoff, als 
Additiv furgetrocknete oder gefrorene Nahrungsmittel sowie in Getranken verwendet 
Sie wird jedoch auch in der pharmazeutischen Industrie, der Kosmetik- und Biotechno- 
logie-lndustrie angewendet (s. bspw. Nishimoto et al., (1998) US-Patent Nr 5 759 610- 
Singer, MA. und Lindquist, S. Trends Biotech. 16 (1998) 460-467; Paiva C L A und ' 

r<Tot' A D ' Bi0teCh Ann " ReV ' 2 (1 " 6) 293_314: Und Shios aka. M. J. Japan 172 
(1997) 97-102). Trehalose wird durch Enzyme von vielen Mikroorganismen produziert 
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und auf naturliche Weise in das umgebende Medium abgegeben, aus dem sie durch 
im Fachgebiet bekannte Verfahren gewonnen werden kann. 

Besonders bevorzugte biosynthetische Produkte sind ausgewahlt aus der Gruppe or- 
ganische Sauren, Proteine, Nukleotide und Nukleoside, sowohl proteinogene als auch 
mcht-proteinogene Aminosauren, Lipide und Fettsauren. Diole, Kohlehydrate, aromati- 
sche Verbindungen, Vitamine und Cofaktoren, Enzyme und Proteine. 

Bevorzugte organische Sauren sind Weinsaure, Itaconsaure und Diaminopimelinsaure 

Bevorzugte Nukleoside und Nukleotide sind beispielsweise beschrieben in Kuninaka, 
A. (1996) Nucleotides and related compounds, S. 561-612, in Biotechnology Bd. 6, 
Rehm et al., Hrsg. VCH: Weinheim und den darin enthaltenen Zitaten. 

Bevorzugte biosynthetische Produkte sind weiterhin Lipide, gesattigte und ungesattigte 
Fettsauren, wie beispielsweise Arachidonsaure, Diole wie beispielsweise Propandiol 
und Butandiol, Kohlenhydrate, wie beispielsweise Hyaluronsaure und Trehalose aro- 
matische Verbindungen, wie beispielsweise aromatische Amine, Vanillin und Indigo, 
Vitamine und Cofaktoren, wie beispielsweise beschrieben in Ullmann's Encyclopedia of 
Industrial Chemistry, Bd. A27, "Vitamins", S. 443-613 (1996) VCH: Weinheim und den 
darin enthaltenen Zitaten; und Ong, AS., Niki, E. und Packer, L. (1995) "Nutrition Lip- 
ids, Health and Disease" Proceedings of the UNESCO/Confederation of Scientific and 
Technological Associations in Malaysia and the Society for Free Radical Research - 
Asien, abgehalten am 1.-3. Sept. 1994 in Penang, Malysia, AOCS Press (1995)) En- 
zyme Polyketide (Cane et al. (1998) Science 282: 63-68), und samtliche anderen von 
Gutcho (1983) in Chemicals by Fermentation, Noyes Data Corporation, ISBN: 
0818805086 und den darin angegebenen Literaturstellen, beschriebenen Chemikalien. 

Besonders bevorzugte Gene, die mit den erfindungsgema&en Promotoren in Pflanzen 
der Gattung Tagetes exprimiert werden sind demnach Gene, ausgewahlt sind aus der 
Gruppe Nukleinsauren kodierend ein Protein aus den Biosyntheseweg von proteinoge- 
nen und nicht-proteinogenen Aminosauren, Nukleinsauren kodierend ein Protein aus 
dem Biosyntheseweg von Nukleotiden und Nukleosiden, Nukleinsauren kodierend ein 
Protein aus dem Biosyntheseweg von organischen Sauren, Nukleinsauren kodierend 
ein Protein aus dem Biosyntheseweg von Lipiden und Fettsauren, Nukleinsauren ko- 
dierend ein Protein aus dem Biosyntheseweg von Diolen, Nukleinsauren kodierend ein 
Protein aus dem Biosyntheseweg von Konhlenhydraten, Nukleinsauren kodierend ein 
Protein aus dem Biosyntheseweg von aromatischen Verbindung, Nukleinsauren kodie- 
rend ein Protein aus dem Biosyntheseweg von Vitaminen, Nukleinsauren kodierend ein 
Protein aus dem Biosyntheseweg von Carotinoiden, insbesondere Ketocarotinoiden, 
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Nukleinsauren kodierend ein Protein aus dem Biosyntheseweg von Cofaktoren und 
Nuklemsauren kodierend ein Protein aus dem Biosyntheseweg von Enzymen. 

Bevorzugte Feinchemikalien Oder biosynthetische Produkte, die in Pflanzen der Gat- 
tung Tagetes, insbesondere in Petalen der BICiten der Pflanzen der Gattung Tagetes 
hergestellt werden konnen, sind Carotinoide, wie beispielsweise Phytoen, Lycopin 
Lutein, Zeaxanthin, Astaxanthin, Canthaxanthin, Echinenon, 3-Hydroxyechinenon 3'- 
Hydroxyechinenon, Adonirubin, Violaxanthin und Adonixanthin. 

Besonders bevorzugte Carotinoide sind Ketocarotinoide, wie beispielsweise Asta- 
xanth.n, Canthaxanthin, Echinenon, 3-Hydroxyechinenon, S'-Hydroxyechinenon, Adoni- 
rubin, Violaxanthin und Adonixanthin. 

Ganz besonders bevorzugte Gene, die mit den erfindungsgemaften Promotoren in 
Pflanzen der Gattung Tagetes exprimiert werden sind demnach Gene die Proteine aus 
dem Biosyntheseweg von Carotinoiden kodiern. 

Insbesondere bevorzugt sind Gene ausgewahlt sind aus der Gruppe Nukleinsauren 
kod.erend eine Ketolase, Nukleinsauren kodierend eine P-Hydroxylase, Nukleinsauren 
kodierend eine p-Cyclase, Nukleinsauren kodierend eine e-Cyclase, Nukleinsauren 
kodierend eine Epoxidase, Nukleinsauren kodierend eine HMG-CoA-Reduktase Nuk- 
leinsauren kodierend eine (E)-4-Hydroxy-3-Methylbut-2-enyl-Diphosphat-Reduktase 
Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5-Phosphat-Synthase, Nukleinsauren 
kod.erend eine 1-Deoxy-D-Xylose-5-Phosphat-Reduktoisomerase. Nukleinsauren ko- 
d.erend eine Isopentenyl-Diphosphat-A-lsomerase, Nukleinsauren kodierend eine Ge- 
ranyl-Diphosphat-Synthase, Nukleinsauren kodierend eine Farnesyl-Diphosphat- 
Synthase, Nukleinsauren kodierend eine Geranyl-Geranyl-Diphosphat-Synthase Nuk- 
leinsauren kodierend eine Phytoen-Synthase, Nukleinsauren kodierend eine Phytoen- 
Desaturase, Nukleinsauren kodierend eine Prephytoen-Synthase, Nukleinsauren ko- 
d.erend eine Zeta-Carotin-Desaturase, Nukleinsauren kodierend ein crtlSO Protein 
Nukleinsauren kodierend ein FtsZ Protein und Nukleinsauren kodierend ein MinD Pro- 
tein. 



Unter einer Ketolase wird ein Protein verstanden, das die enzymatische Aktivitat auf- 
weist. am, gegebenenfalls substituierten, p-lonon-Ring von Carotinoiden eine Keto- 
Gruppe einzufuhren. 

Insbesondere wird unter einer Ketolase ein Protein verstanden, das die enzymatische 
Aktivitat aufweist, p-Carotin in Canthaxanthin umzuwandeln. 
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Beispiele fur Nukleinsauren, kodierend eine Ketolase, und die entsprechenden Ketola- 
sen, sind beispielsweise Sequenzen aus 

Haematoccus pluvialis, insbesondere aus Haematoccus pluvialis Flotow em. Wille (Ac- 
cession NO: X86782; Nukleinsaure: SEQ ID NO: 15, Protein SEQ ID NO: 16), 

Haematoccus pluvialis, NIES-144 (Accession NO: D45881; Nukleinsaure: SEQ ID NO: 
17, Protein SEQ ID NO: 18), 

Agrobacterium aurantiacum (Accession NO: D58420; Nukleinsaure: SEQ ID NO: 19, 
Protein SEQ ID NO: 20), 

Alicaligenes spec. (Accession NO: D58422; Nukleinsaure: SEQ ID NO: 21, Protein 
SEQ ID NO: 22), 

Paracoccus marcusii (Accession NO: Y15112; Nukleinsaure: SEQ ID NO: 23, Protein 
SEQ ID NO: 24). 

Synechocystis sp. Strain PC6803 (Accession NO: NP442491; Nukleinsaure: SEQ ID 
NO: 25, Protein SEQ ID NO: 26). 

Bradyrhizobium sp. (Accession NO: AF218415; Nukleinsaure: SEQ ID NO: 27, Protein 
SEQ ID NO: 28). 

Nostocsp. Strain PCC7120 (Accession NO: AP003592, BAB74888; Nukleinsaure: 
SEQ ID NO: 29, Protein SEQ ID NO: 30). 

Haematococcus pluvialis 

(Accession NO: AF534876, AAN03484; Nukleinsaure: SEQ ID NO: 31, Protein : SEQ 
ID NO: 32) 

Paracoccus sp. MBIC1 143 

(Accession NO: D58420, P54972; Nukleinsaure: SEQ ID NO: 33, Protein : SEQ ID NO: 
34) 

Brevundimonas aurantiaca 

(Accession NO: AY166610, AAN86030; Nukleinsaure: SEQ ID NO: 35, Protein : SEQ 
ID NO: 36) 
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(Accession NO: AY210783, AA064399; Nukleinsaure: SEQ ID NO: 37 Protein ■ SEQ 
ID NO: 38) 

Nostoc punctiforme ATCC 29133 

(Accession NO: NZ_AABC01000195, ZP_001 11258; Nukleinsaure: SEQ ID NO: 39, 
Protein : SEQ ID NO: 40) 

Nostoc punctiforme ATCC 29133 

(Accession NO: NZ_AABC01000196; Nukleinsaure: SEQ ID NO: 41, Protein ■ SEQ ID 
NO: 42) 

Deinococcus radiodurans R1 

(Accession NO: E75561, AE001872; Nukleinsaure: SEQ ID NO: 43, Protein ■ SEQ ID 
NO: 44), 

Synechococcus sp. WH 8102, 

Nukleinsaure: Acc.-No. NZ_AABD0 1000001, Basenpaar 1,354,725-1,355,528 (SEQ ID 
NO: 75), Protein: Acc.-No. ZP_001 15639 (SEQ ID NO: 76) (als putatives Protein anno- 
tiert), 

Unter einer p-Cyclase wird ein Protein verstanden, das die enzymatische Aktivitat auf- 
weist, einen endstandigen, linearen Rest von Lycopin in einen p-lonon-Ring zu Ober- 
fGhren. 

Insbesondere wird unter einer p-Cyclase ein Protein verstanden, das die enzymatische 
Aktivitat aufweist, y-Carotin in p-Carotin umzuwandeln. 

Beispiele fur p-Cyclase-Gene sind Nukleinsauren, kodierend eine p-Cyclase aus To- 
mate (Accession X86452).(Nukleinsaure: SEQ ID NO: 45, Protein: SEQ ID NO: 46), 
sowie p-Cyclasen der folgenden Accession Nummern: 

S66350 lycopene beta-cyclase (EC 5.5.1.-) - tomato 

CAA601 1 9 lycopene synthase [Capsicum annuum] 

S66349 lycopene beta-cyclase (EC 5.5. 1 .-) - common tobacco 

CAA57386 lycopene cyclase [Nicotiana tabacum] 

AAM21 1 52 lycopene beta-cyclase [Citrus sinensis] 

AAD38049 lycopene cyclase [Citrus x paradisi] 

AAN86060 lycopene cyclase [Citrus unshiu] 

AAF44700 lycopene beta-cyclase [Citrus sinensis] 

AAK07430 lycopene beta-cyclase [Adonis palaestina] 
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AAA81880 




AAB53337 




AAL92175 
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CAA67331 




AAM45381 




AA018661 




AAG21133 




AAF18989 


10 


ZP_001140 




ZP_001050 




ZP_001046 




ZP_001134 


P 


ZP_001150 




AAF 10377 




BAA29250 




BAC77673 


20 


AAL01999 




ZP_000190 




ZP_000941 




AAF78200 




BAB79602 


25 


CAA64855 




AAA21262 




C37802 




BAB79602 


bo 


AAA64980 




AAC44851 




BAA09593 




ZP_000941 




CAB56061 




BAA20275 


35 
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AAK07430 
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beta cyclase [Tagetes erecta] 
lycopene cyclase 
Lycopene beta cyclase 

beta-lycopene cyclase [Sandersonia aurantiaca] 
lycopene cyclase [Narcissus pseudonarcissus] 
beta cyclase [Tagetes erecta] 
lycopene beta-cyclase [Zea mays] 

chromoplast-specific lycopene beta-cyclase [Lycopersicon esculentum] 

lycopene beta-cyclase [Daucus carota] 

hypothetical protein [Prochlorococcus marinus str. MIT9313] 

hypothetical protein [Prochlorococcus marinus subsp. pastoris str. 

CCMP1378] 

hypothetical protein [Prochlorococcus marinus subsp. pastoris str. 
CCMP1378] 

hypothetical protein [Prochlorococcus marinus str. MIT9313] 

hypothetical protein [Synechococcus sp. WH 8102] 

lycopene cyclase [Deinococcus radiodurans] 

393aa long hypothetical protein [Pyrococcus horikoshii] 

lycopene beta-monocyclase [marine bacterium P99-3] 

lycopene cyclase [Xanthobacter sp. Py2] 

hypothetical protein [Chloroflexus aurantiacus] 

hypothetical protein [Novosphingobium aromaticivorans] 

lycopene cyclase [Bradyrhizobium sp. ORS278] 

crtY [Pantoea agglomerans pv. milletiae] 

lycopene cyclase [Streptomyces griseus] 

dycopene cyclase [Pantoea agglomerans] 

crtY protein - Erwinia uredovora 

crtY [Pantoea agglomerans pv. milletiae] 

lycopene cyclase [Pantoea agglomerans] 

lycopene cyclase 

Lycopene cyclase [Paracoccus sp. MBIC1143] 
hypothetical protein [Novosphingobium aromaticivorans] 
lycopene beta-cyclase [Paracoccus marcusii] 
lycopene cyclase [Erythrobacter longus] 
hypothetical protein [Thermobifida fusca] 
hypothetical protein [Chloroflexus aurantiacus] 
lycopene beta-cyclase [Adonis palaestina] 
lycopene cyclase [Narcissus pseudonarcissus] 
Lycopene beta cyclase 

lycopene beta-monocyclase [marine bacterium P99-3] 
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Eine besonders bevorzugte p-Cyclase ist weiterhin die chromoplastenspezifische B- 
Cyclase aus Tomate (AAG21133) (Nukleinsaure: SEQ. ID. No. 49; Protein- SEQ ID 
No. 50) 

Unter einer Hydroxylase wird ein Protein verstanden, das die enzymatische Aktivitat 
aufweist, am, gegebenenfalls substituierten, B-lonon-Ring von Carotinoiden eine 
Hydroxy-Gruppe einzufuhren. 

Insbesondere wird unter einer Hydroxylase ein Protein verstanden, das 

die enzymatische Aktivitat aufweist, 0-Carotin in Zeaxanthin oder Canthaxanthin in 

Astaxanthin umzuwandeln. 

Beispiele fOr ein Hydroxy lase-Gene sind: 

eine Nukleinsaure, kodierend eine Hydroxylase aus Haematococcus pluvialis, Accessi- 
on AX038729, WO 0061764); (Nukleinsaure: SEQ ID NO: 49, Protein- SEQ ID NO- 
50), 

sowie Hydroxylasen der folgenden Accession Nummern: 

|emb|CAB55626.1, CAA70427.1, CAA70888.1, CAB55625.1. AF499108_1, 
AF315289_1, AF296158_1, AAC49443.1, NP_194300.1, NP_200070.1, AAG10430 1 
CAC06712.1, AAM88619.1, CAC95130.1, AAL80006.1, AF162276_1, AA053295 1 
AAN85601 . 1 , CRTZ_ERWHE, CRTZ_PANAN, BAB79605. 1 , CRTZ_ALCSP, 
CRTZ_AGRAU, CAB56060.1, ZP_00094836.1, AAC44852.1, BAC77670.1, 
NP_745389.1, NP_344225.1, NP_849490.1, ZP_00087019.1, NP_503072.1 
NP_852012. 1 , NP_1 1 5929. 1 , ZP_0001 3255. 1 

Eine besonders bevorzugte Hydroxylase ist weiterhin die Hydroxylase aus Tomate 
(Accession Y14810, CrtR-b2) (Nukleinsaure: SEQ ID NO: 51; Protein: SEQ ID NO. 52). 

Unter einer HMG-CoA-Reduktase wird ein Protein verstanden, das die enzymatische 
Aktivitat aufweist, 3-Hydroxy-3-Methyl-Glutaryl-Coenzym-A in Mevalonat umzuwan- 
deln. 

Unter einer (E)-4-Hydroxy-3-Methylbut-2-enyl-Diphosphat-Reduktase wird ein Protein 
verstanden, das die enzymatische Aktivitat aufweist, (E)-4-Hydroxy-3-Methylbut-2-enyl- 
Diphosphat in Isopentenyldiphosphat und Dimethylallyldiphosphate umzuwandeln. 
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Unter einer 1-Deoxy-D-Xylose-5-Phosphat-Synthase wird ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, Hydroxyethyl-ThPP und Glycerinaldehyd-3- 
Phosphat in 1-Deoxy-D-Xylose-5-Phosphat umzuwandeln. 

Unter einer 1-Deoxy-D-Xylose-5-Phosphat-Reduktoisomerase wird ein Protein ver- 
standen, das die enzymatische Aktivitat aufweist, 1-Deoxy-D-Xylose-5-Phosphat in 2- 
C-methyl-D-erythritol 4-Phosphat umzuwandeln 

Unter einer Isopentenyl-Diphosphat-A- Isomerase wird ein Protein verstanden, das die 
enzymatische Aktivitat aufweist, Isopentenyl-Diphosphat in Dimethylaliylphosphat um- 
zuwandeln. 

Unter einer Geranyl-Diphosphat-Synthase wird ein Protein verstanden, das die enzy- 
matische Aktivitat aufweist, Isopentenyl-Diphosphat und Dimethylaliylphosphat in Ge- 
ranyl-Diphosphat umzuwandeln. 

Unter einer Farnesyl-Diphosphat-Synthase wird ein Protein verstanden, das die enzy- 
mat.sche Aktivitat aufweist, sequentiell 2 Molekulelsopentenyl-Diphosphatmit Dimethy- 
lallyl-Diphosphat und dem resultierenden Geranyl-Diphosphat in Famesyl-Diphosphat 
umzuwandeln f 

Unter einer Geranyl-Geranyl-Diphosphat-Synthase wird ein Protein verstanden, das die 
enzymatische Aktivitat aufweist, Farnesyl-Diphosphat und Isopentenyl-Diphosphat in 
Geranyl-Geranyl-Diphosphat umzuwandeln. 

Unter einer Phytoen-Synthase wird ein Protein verstanden, das die enzymatische Akti- 
vitat aufweist, Geranyl-Geranyl-Diphosphat in Phytoen umzuwandeln. 

Unter einer Phytoen-Desaturase wird ein Protein verstanden, das die enzymatische 
Aktivitat aufweist, Phytoen in Phytofluen und/oder Phytofluen in ^-Carotin (Zetacarotin) 
umzuwandeln. 

Unter einer Zeta-Carotin-Desaturase wird ein Protein verstanden, das die enzymati- 
sche Aktivitat aufweist, C-Carotin in Neurosporin und/oder Neurosporin in Lycopin um- 
zuwandeln. 

Unter einem crtlSO-Proteins wird ein Protein verstanden, das die enzymatische Aktivi- 
tat aufweist, ^./'.Q'-tetra-cis-Lycopin in all-trans-Lycopin umzuwandeln. 
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Unter einem FtsZ-Protein wird ein Protein verstanden, das eine Zellteilungs und Plasti- 
denteilungs-fordernde Wirkung hat und Homologien zu Tubulinproteinen aufweist. 

Unter einem MinD -Protein wird ein Protein verstanden, das eine muitifunktionele Rolle 
bei der Zellteilung aufweist. Es ist eine Membran-assoziierte ATPase und kann inner- 
halb der Zelle eine oszillierende Bewegung von Pol zu Pol zeigen. 

Beispiele fur HMG-CoA-Reduktase-Gene sind: 

Eine Nukleinsaure, kodierend eine HMG-CoA-Reduktase aus Arabidopsis thaliana, 
Accession NM_1 06299; (Nukleinsaure: SEQ ID NO: 53, Protein: SEQ ID NO: 54), ' 

sowie weitere HMG-CoA-Reduktase -Gene aus anderen Organismen mit den folgen- 
den Accession Nummern: 

P54961, P54870, P54868, P54869, 002734, P22791, P54873, P54871, P23228, 
P13704, P54872, Q01581, P17425, P54874, P54839, P14891, P34135! 064966, 
P29057, P48019, P48020, P12683, P43256, Q9XEL8, P34136, 064967, P29058, 
P48022, Q41437, P12684, Q00583, Q9XHL5, Q41438, Q9YAS4, 076819, 028538, 
Q9Y7D2, P54960, 051628, P48021, Q03163, P00347, P14773, Q12577, Q59468, ' 
P04035, 024594, P09610, Q58116, 026662, Q01237, Q01559, Q12649, 074164,' 
059469, P51639, Q10283, 008424, P20715, P13703, P13702, Q96UG4, Q8SQZ9, 
015888, Q9TUM4, P93514, Q39628, P93081, P93080, Q944T9, Q40148, Q84MM0 
Q84LS3, Q9Z9N4, Q9KLM0 

Beispiele fQr (E)-4-Hydroxy-3-Methylbut-2-enyl-Diphosphat-Reduktase-Gene sind: 

Eine Nukleinsaure, kodierend eine (E)-4-Hydroxy-3-Methylbut- 
2-enyl-Diphosphat-Reduktase aus Arabidopsis thaliana (lytB/ISPH), ACCESSION 
AY1 68881, (Nukleinsaure: SEQ ID NO: 55, Protein: SEQ ID NO:56), 

sowie weitere (E)-4-Hydroxy-3-Methylbut-2-enyl-Diphosphat-Reduktase -Gene aus 
anderen Organismen mit den folgenden Accession Nummern: 

T04781, AF270978_1, NP_485028.1, NP_442089.1, NP_681832.1, ZP_001 10421.1, 
ZP_00071594.1, ZP_001 14706.1, ISPH_SYNY3, ZP_00 11 4087.1, ZP_00 104269.1, 
AF398145J, AF398146_1, AAD55762.1, AF514843_1, NP_622970.1, NP_348471.1, 
NP_562001 . 1 , NP_223698. 1 , NP_78 1 941 . 1 , ZP_00080042. 1 , NP_859669. 1 , 
NP_214191.1, ZP_00086191.1, ISPH_VIBCH, NP_230334.1, NP_742768.1, 
NP_302306.1, ISPH_MYCLE, NP_602581.1, ZP_00026966.1, NP_520563.1, 
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NP_253247.1, NP_282047.1, ZP_00038210.1, ZP_00064913.1, CAA61555.1 , 
ZP_001 25365.1, ISPH_ACICA, EAA24703.1, ZP_0001 3067. 1, ZP_000291 64.1, 
NP_790656.1, NP_217899.1, NP_641592.1, NP_636532.1, NP_719076.1, 
NP_660497.1, NP_422155.1, NP_715446.1, ZP_00090692.1, NP_759496.1, 
ISPH_BURPS, ZP_001 29657.1, NP_215626.1, NP_335584.1, ZP_001 3501 6.1, 
NP_789585. 1 , NP_787770. 1 , NP_769647. 1 , ZP_00043336. 1 , NP_242248. 1 , 
ZP_00008555.1, NP_246603.1, ZP_00030951.1, NP_670994.1, NP_404120.1, 
NP_540376. 1 , NP_733653. 1 , NP_697503. 1 , NP_840730. 1 , NpI274828. 1 , 
NP_796916.1, ZP_001 23390.1, NP_824386.1, NP_737689.1, ZP_0002 1222.1, 
NP_757521.1, NP_390395.1, ZP_00 133322.1, CAD76178.1, NP_600249.1, 
NP_454660.1, NP_712601.1, NP_385018.1, NP_751989.1 

Beispiele fur 1-Deoxy-D-Xylose-5-Phosphat-Synthase -Gene sind: 

Eine Nukleinsaure, kodierend eine 1-Deoxy-D-Xylose-5-Phosphat-Synthase aus Lyco- 
persicon esculentum, ACCESSION #AF143812 (Nukleinsaure: SEQ ID NO- 57 Prote- 
in: SEQ ID NO: 58), 

sowie weitere 1-Deoxy-D-Xylose-5-Phosphat-Synthase -Gene aus anderen Organis- 
men mit den folgenden Accession Nummern: 

AF143812_1, DXS_CAPAN, CAD22530.1, AF182286_1, NP_193291.1, T52289, 
AAC49368.1, AAP14353.1, D71420, DXS_ORYSA, AF443590_1, BAB02345.1, 
CAA09804.2, NP_850620.1, CAD22155.2, AAM65798.1, NP_566686.1, CAD22531.1, 
AAC33513.1, CAC08458.1, AAG10432.1, T08140, AAP14354.1, AF428463_1, 
ZP_0001 0537.1, NP_769291.1, AAK59424.1, NP_107784.1, NP_697464.1, 
NP_540415.1, NP_196699.1, NP_384986.1, ZP_00096461.1, ZP_0001 3656.1, 
NP_353769.1, BAA83576.1, ZP_00005919.1, ZP_00006273.1, NP_420871.1, ' 
AAM48660.1, DXS_RHOCA, ZP_00045608.1, ZP_0003 1686.1, NP_841218.1, 
ZP_00022174.1, ZP_00086851.1, NP_742690.1, NP_520342.1, ZP_00082 120.1, 
NP_790545.1, ZP_00125266.1, CAC17468.1, NP_252733.1, ZP_00092466.1, 
NP_439591.1, NP_414954.1, NP_752465.1, NP_622918.1, NP_286162.1, 
NP_836085.1, NP_706308.1, ZP_00081148.1, NP_797065.1, NP_213598.1, 
NP_245469.1, ZP_00075029. 1 , NP_455016.1, NP_230536.1, NP_459417.l] 
NP_274863. 1 , NP_283402. 1 , NP_7593 18.1, NP_406652. 1 , DXS_SYNLE, 
DXS_SYNP7, NP_440409.1, ZP_00067331.1, ZP_00122853.1, NP_717142.1, 
ZP_001 04889.1, NP_243645.1, NP_681412.1, DXS_SYNEL, NP_637787.1, 
DXS_CHLTE, ZP_00 129863.1, NPJ361241.1, DXS_XANCP, NP_470738.1, 
NP_484643.1, ZP_00 108360.1, NP_833890.1, NP_846629.1, NP_658213.1, 
NP_642879.1, ZP_00039479.1, ZP_00060584.1, ZP_0004 1364.1, ZP_001 17779.1, 
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NP_299528.1 

Beispiele fQr 1-Deoxy-D-Xylose-5-Phosphat-Reduktoisomerase-Gene sind: 

Eine Nukleinsaure, kodierend eine 1-Deoxy-D-Xylose-5-Phosphat-Reduktoisomerase 
aus Arabidopsis thaliana, ACCESSION #AF148852, (Nukleinsaure: SEQ ID NO: 59 . 
Protein: SEQ ID NO: 60), 

sowie weitere 1-Deoxy-D-Xylose-5-Phosphat-Reduktoisomerase-Gene aus anderen 
Organismen mit den folgenden Accession Nummern: 

AF148852, AY084775, AY054682, AY050802, AY045634, AY081453, AY091405, 
AY098952, AJ242588, AB009053, AY202991, NP_201085.1, T52570, AF331705ll 
BAB16915.1, AF367205_1, AF250235_1, CAC03581.1, CAD22156.1," AF182287_1,' 
DXR_MENPI, ZP_00071 219.1, NP_488391.1, ZP_001 11307.1, DXR_SYNLE, 
AAP56260.1, NP_681831.1, NP_4421 13. 1, ZP_001 15071.1, ZP_00105106.1, 
ZP_001 13484.1, NP_833540.1, NP_657789.1, NP_661031.1, DXR_BACHD, ' 
NP_833080.1, NP_845693.1, NP_562610.1, NP_623020.1, NP_810915.1, 
NP_243287.1, ZP_001 18743.1, NP_464842.1, NP_470690.1, ZP_00082201.1, 
NP_781898.1, ZP_00123667.1, NP_348420.1, NP_604221.1, ZP_00053349.l[ 
ZP_00064941.1, NP_246927.1, NP_389537.1, ZP_00 102576.1, NP_519531.l', 
AF124757_19, DXR_ZYMMO, NP_713472.1, NP_459225.1, NP_454827.1, 
ZP_00045738.1, NP_743754.1, DXR_PSEPK, ZP_00 130352.1, NP_702530.1, 
NP_841744.1, NP_438967.1, AF514841_1, NP_706118.1, ZP_00 125845.1, 
NP_404661.1, NP_285867.1, NP_240064.1, NP_414715.1, ZP_00094058. 1 , 
NP_791365.1, ZP_0001 2448.1, ZP_00015132.1, ZP_0009 1545.1, NP_629822.1, 
NP_771495.1, NP_798691.1, NP_231885.1, NP_252340.1, ZP_00022353.1, 
NP_355549.1, NP_420724.1, ZP_00085169.1, EAA17616.1, NP_273242.1, ' 
NP_219574.1, NP_387094.1, NP_296721.1, ZP_00004209.1, NP_823739.1, 
NP_282934.1, BAA77848.1, NP_660577.1, NP_760741.1, NP_641750.1, 
NP_636741.1, NP_829309.1, NP_298338.1, NP_444964.1, NP_7 17246.1, 
NP_224545. 1 , ZP_00038451 . 1 , DXR_KITGR, NP_778563. 1 . 

Beispiele for Isopentenyl-Diphosphat-A-lsomerase-Gene sind: 

Eine Nukleinsaure, kodierend eine Isopentenyl-Diphosphat-A-lsomerase aus Adonis 
palaestina clone AplPI28, (ipiAal), ACCESSION #AF1 88060, veroffentlicht durch Cun- 
ningham,F.X. Jr. and Gantt,E.: Identification of multi-gene families encoding isopente- 
nyl diphosphate isomerase in plants by heterologous complementation in Escherichia 
coli, Plant Cell Physiol. 41 (1), 119-123 (2000) (Nukleinsaure: SEQ ID NO: 61, Protein: 
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SEQ ID NO: 62), 

sowie weitere Isopentenyl-Diphosphat-A-lsomerase-Gene aus anderen Organismen 
mit den folgenden Accession Nummern: 

Q38929, 048964, Q39472, Q13907, 035586, P58044, 042641, 035760, Q10132, 
P15496, Q9YB30, Q8YNH4, Q42553, 027997, P50740, 051627, 048965, Q8KFR5, 
Q39471, Q39664, Q9RVE2, Q01335, Q9HHE4, Q9BXS1, Q9KWF6, Q9CIF5, 
Q88WB6, Q92BX2, Q8Y7A5, Q8TT35 Q9KK75, Q8NN99, Q8XD58, Q8FE75, 
Q46822, Q9HP40, P72002, P26173, Q9Z5D3, Q8Z3X9, Q8ZM82, Q9X7Q6, 013504, 
Q9HFW8, Q8NJL9, Q9UUQ1, Q9NH02, Q9M6K9, Q9M6K5, Q9FXR6, 081691, 
Q9S7C4, Q8S3L8, Q9M592, Q9M6K3, Q9M6K7, Q9FV48, Q9LLB6, Q9AVJ1, 
Q9AVG8, Q9M6K6, Q9AVJ5, Q9M6K2, Q9AYS5, Q9M6K8, Q9AVG7, Q8S3L7, 
Q8W250, Q94IE1, Q9AVI8, Q9AYS6, Q9SAY0, Q9M6K4, Q8GVZ0, Q84RZ8, 
Q8KZ12, Q8KZ66, Q8FND7, Q88QC9, Q8BFZ6, BAC26382, CAD94476. 

Beispiele fur Geranyl-Diphosphat-Synthase -Gene sind: 

Eine Nukleinsaure, kodierend eine Geranyl-Diphosphat-Synthase aus Arabidopsis tha- 
liana, ACCESSION #Y17376, Bouvier.F., Suire.C, d'Harlingue.A., Backhaus,R.A. and 
Camara.B.; Molecular cloning of geranyl diphosphate synthase and compartmentation 
of monoterpene synthesis in plant cells, Plant J. 24 (2), 241-252 (2000) (Nukleinsaure: 
SEQ ID NO: 63, Protein: SEQ ID NO: 64), 

sowie weitere Geranyl-Diphosphat-Synthase-Gene aus anderen Organismen mit den 
folgenden Accession Nummern: 

Q9FT89, Q8LKJ2, Q9FSW8, Q8LKJ3, Q9SBR3, Q9SBR4, Q9FET8, Q8LKJ1, 
Q84LG1, Q9JK86 

Beispiele fur Farnesyl-Diphosphat-Synthase-Gene sind: 

Eine Nukleinsaure, kodierend eine Farnesyl-Diphosphat-Synthase aus Arabidopsis 
thaliana (FPS1), ACCESSION #U80605, verdffentlicht durch Cunillera.N., Arro.M., De- 
lourme.D., Karst.F., Boronat,A. und Ferrer.A: Arabidopsis thaliana contains two diffe- 
rentially expressed farnesyl-diphosphate synthase genes, J. Biol. Chem. 271 (13), 
7774-7780 (1996), (Nukleinsaure: SEQ ID NO: 65, Protein: SEQ ID NO:66), 
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sowie weitere Farnesyl-Diphosphat-Synthase-Gene aus anderen Organismen mit den 
folgenden Accession Nummern: 

P53799, P37268, Q02769, Q09152, P49351, 024241, Q43315, P49352. 024242, 
5 P49350, P08836, P14324, P49349, P08524, 066952, Q08291, P54383, Q45220, 
P57537, Q8K9A0, P22939, P45204, 066126, P55539, Q9SWH9, Q9AVI7, Q9FRX2, 
Q9AYS7, Q94IE8, Q9FXR9, Q9ZWF6, Q9FXR8, Q9AR37, O50009.Q94IE9.Q8RVK7, 
Q8RVQ7, 004882, Q93RA8, Q93RB0, Q93RB4, Q93RB5.Q93RB3, Q93RB1, 
Q93RB2, Q920E5. 

10 

Beispiele fOr Geranyl-geranyl-Diphosphat-Synthase -Gene sind: 

Eine Nukleinsaure, kodierend eine Geranyl-geranyl-Diphosphat-Synthase aus Sinaps 
alba, ACCESSION #X98795, veroffentlicht durch Bonk,M., Hoffmann.B., Von Lintig.J., 
Schledz,M., AI-Babili,S., Hobeika.E., Kleinig.H. and Beyer.P.: Chloroplast import of four 
carotenoid biosynthetic enzymes in vitro reveals differential fates prior to membrane 
binding and oligomeric assembly, Eur. J. Biochem. 247 (3), 942-950 (1997), (Nuklein- 
saure: SEQ ID NO: 67, Protein: SEQ ID NO: 68), 

20 sowie weitere Geranyl-geranyl-Diphosphat-Synthase-Gene aus anderen Organismen 
mit den folgenden Accession Nummern: 

P22873, P34802 .P56966, P80042, Q42698, Q92236, 095749, Q9WTN0, Q50727, 
P24322, P39464, Q9FXR3, Q9AYN2, Q9FXR2, Q9AVG6, Q9FRW4, Q9SXZ5, 
25 Q9AVJ7, Q9AYN1, Q9AVJ4, Q9FXR7, Q8LSC5, Q9AVJ6, Q8LSC4, Q9AVJ3, 
Q9SSU0, Q9SX26. Q9SST9, Q9AVJ0, Q9AVI9, Q9FRW3, Q9FXR5, Q94IF0, 
Q9FRX1, Q9K567, Q93RA9, Q93QX8, CAD95619, EAA31459 

Beispiele fOr Phytoen-Synthase-Gene sind: 

Eine Nukleinsaure, kodierend eine Phytoen-Synthase aus Erwinia uredovora, ACCES- 
SION # D90087; veroffentlicht durch Misawa.N., Nakagawa.M., Kobayashi.K., Yama- 
no.S., lzawa,Y.,Nakamura,K. und Harashima.K.: Elucidation of the Erwinia uredovora 
carotenoid biosynthetic pathway by functional analysis of gene products expressed in 
Escherichia coli; J. Bacterid. 172 (12), 6704-6712 (1990), (Nukleinsaure: SEQ ID NO: 
69, Protein: SEQ ID NO: 70), 

sowie weitere Phytoen-Synthase -Gene aus anderen Organismen mit den folgenden 
Accession Nummern: 

40 
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CAB39693, BAC69364, AAF10440, CAA45350, BAA20384, AAM72615 BAC09112 
CAA48922 > P_001091 1 CAB84588,AAF41518 > CAA48155 1 AAD38051 AAF33237 ' 
AAG10427, AAA34187, BAB73532, CAC19567, AAM62787, CAA55391, AAB65697 
AAM45379, CAC27383, AAA32836, AAK07735, BAA84763, P_000205 AAB60314 ' 
P_001163, P_000718, AAB71428, AAA34153, AAK07734, CAA42969 CAD76176 ' 
CAA68575, P_000130, P_001142, CAA47625, CAA85775, BAC14416, CAA79957 
BAC76563, P_000242, P_000551, AAL02001, AAK15621, CAB94795 AAA91951 ' 
P_000448 



Beispiele fCir Phytoen-Desaturase-Gene sind: 

Eine Nukleinsaure, kodierend eine Phytoen-Desaturase aus Erwinia uredovora, AC- 
CESSION # D90087; veroffentlicht durch Misawa.N., Nakagawa.M., Kobayashi.K., 
Yamano.S., lzawa,Y.,Nakamura,K. und Harashima.K.: Elucidation of the Erwinia ure- 
dovora carotenoid biosynthetic pathway by functional analysis of gene products ex- 
pressed in Escherichia coli; J. Bacteriol. 172 (12), 6704-6712 (1990), (Nukleinsaure- 
SEQ ID NO: 71, Protein: SEQ ID NO: 72), 

sowie weitere Phytoen-Desaturase -Gene aus anderen Organismen mit den folgenden 
Accession Nummern: 



AAL15300, A39597, CAA42573, AAK51545, BAB08179, CAA48195, BAB82461 
AAK92625, CAA55392, AAG10426, AAD02489, AA024235, AAC12846 AAA99519 
AAL38046, CAA60479, CAA75094, ZP_001041, ZP_001163, CAA39004 CAA44452 
ZP_001142,ZP_000718,BAB82462,AAM45380,CAB56040,ZP_00109'l BAC09113 
AAP79175,AAL80005, AAM72642,AAM72043,ZP_000745,ZP_001141 BAC07889 ' 
CAD55814, ZP_001041, CAD27442, CAE00192, ZP_001163, ZP_000197 BAA18400 
AAG10425, ZP_001119, AAF13698, 2121278A, AAB35386, AAD02462, BAB68552 
CAC85667, AAK51557, CAA12062, AAG51402, AAM63349, AAF85796, BAB7408l' 
AAA91161, CAB56041, AAC48983, AAG14399, CAB65434, BAB73487 ZP_001117 
ZP_000448, CAB39695, CAD76175, BAC69363, BAA17934, ZP_000171, AAF65586 
ZP_000748, BAC07074, ZP_001133, CAA64853, BAB74484, ZP_001156 AAF23289 
AAG28703, AAP09348, AAM71569, BAB69140, ZP_000130, AAF41516, AAG18866 ' 
CAD95940, NP_656310, AAG10645, ZP_000276,.ZP_000192, ZP_000186 
AAM94364, EAA31371 , ZP_00061 2, BAC75676, AAF65582 

Beispiele fur Zeta-Carotin-Desaturase-Gene sind : 

Eine Nukleinsaure, kodierend eine Zeta-Carotin-Desaturase aus Narcissus pseudonar- 
cissus, ACCESSION #AJ224683, verSffentlicht durch AI-Babili.S., Oelschlegel.J. and 
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Beyer.P.: A cDNA encoding for beta carotene desaturase (Accession No.AJ224683) 
from Narcissus pseudonarcissus L. (PGR98-103), Plant Physiol. 117, 719-719 (1998), 
(Nukleinsaure: SEQ ID NO: 73, Protein: SEQ ID NO: 74), 

5 sowie weitere Zeta-Carotin-Desaturase-Gene aus anderen Organismen mit den fol- 
genden Accession Nummern: 

Q9R6X4, Q38893, Q9SMJ3, Q9SE20, Q9ZTP4, 049901, P74306, Q9FV46, Q9RCT2, 
ZDS_NARPS, BAB68552.1, CAC85667.1, AF372617_1, ZDS_TARER, CAD55814.1, ' 
10 CAD27442.1, 2121278A, ZDS_CAPAN, ZDS_LYCES, NP_187138.1, AAM63349.1, ' 
ZDS_ARATH, AAA91 161.1, ZDS_MAIZE, AAG14399.1, NP_441720.1, NP_486422.1, 
ZP_001 11920.1, CAB56041.1, ZP_00074512.1, ZP_001 16357.1, NP_681127.1, 
ZP_001 14185.1, ZP_00104126.1, CAB65434.1, NP_662300.1 

^^^5 Beispiele fur crtlSO-Gene sind: 

Eine Nukleinsaure, kodierend eine crtlSO aus Lycopersicon esculentum; ACCESSION 
#AF416727, veroffentlicht durch Isaacson.T., Ronen.G., Zamir.D. and Hirschberg.J.: 
Cloning of tangerine from tomato reveals a carotenoid isomerase essential for the pro- 
20 duction of beta-carotene and xanthophylls in plants; Plant Cell 14 (2), 333-342 (2002), 
(Nukleinsaure: SEQ ID NO: 75, Protein: SEQ ID NO: 76), 

sowie weitere crtlSO -Gene aus anderen Organismen mit den folgenden Accession 
Nummern: 

25 

AAM53952 

Beispiele fur FtsZ-Gene sind: 

^^^30 Eine Nukleinsaure, kodierend eine FtsZ aus Tagetes erecta, ACCESSION #AF251346, 
veroffentlicht durch Moehs,C.P.. Tian.L, Osteryoung,K.W. and Dellapenna.D.: Analysis 
of carotenoid biosynthetic gene expression during marigold petal development 
Plant Mol. Biol. 45 (3), 281-293 (2001), (Nukleinsaure: SEQ ID NO: 77, Protein: 
SEQ ID NO: 78), 

35 

sowie weitere FtsZ -Gene aus anderen Organismen mit den folgenden Accession 
Nummern: 

CAB89286.1, AF205858_1, NP_200339.1, CAB89287.1, CAB41 987.1, AAA82068.1, 
40 T06774,AF383876_1, BAC57986.1, CAD22047.1, BAB91 150.1, ZP_00072546.1, 
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NP_440816.1, T51092, NP_683172.1, BAA85116.1, NP_487898.1, JC4289, 
BAA82871.1, NP_781763.1, BAC57987.1, ZP_0011 1461.1, T51088, NP_190843.1 
ZP_00060035. 1 , NP_846285. 1 , AAL071 80. 1 , NP_243424. 1 , NP_833626.1 , 
AAN04561.1, AAN04557.1, CAD22048.1, T51089, NP_692394.1, NP_623237.1, 
NP_565839.1, T51090, CAA07676.1, NP_1 13397.1, T51087, CAC44257.1, £84778, 
ZP_001 05267.1, BAA82091.1, ZP_001 12790.1, BAA96782.1, NP_348319.1, 
NP_471472.1, ZP_001 15870.1, NP_465556.1, NP_389412.1, BAA82090.1, ' 
NP_562681.1, AAM22891.1, NP_371710.1, NP_764416.1, CAB95028.1, 
FTSZ_STRGR, AF120117_1, NP_827300.1. JE0282, NP_626341.1, AAC45639.1, 
NP_785689. 1 , NP_336679. 1 , NP_738660. 1 , ZP_00057764. 1 , AAC32265. 1 , 
NP_814733.1, FTSZ_MYCKA, NP_216666.1, CAA75616.1, NP_301700.1, ' 
NP_601357.1, ZP_00046269.1, CAA70158.1, ZP_00037834.1, NP_268026.1, 
FTSZ_ENTHR, NP_787643.1, NP_346105.1, AAC32264.1, JC5548, AAC95440.1, 
NP_710793.1, NP_687509.1, NP_269594.1, AAC32266.1, NP_720988.1, 
NP__657875.1, ZP_00094865. 1 , ZP_00080499.1, ZP_00043589.1, JC7087, 
NP_660559.1, AAC46069.1, AF179611_14, AAC44223.1, NP_404201.1. 

Beispiele fOr MinD -Gene sind: 

Eine Nukleinsaure, kodierend eine MinD aus Tagetes erecta, ACCESSION 
#AF251019, verSffentlichtdurch Moehs.C.P., Tian.L., Osteryoung,K.W. und Dellapen- 
na.D.: Analysis of carotenoid biosynthetic gene expression during marigold petal deve- 
lopment; Plant Mol. Biol. 45 (3), 281-293 (2001), (Nukleinsaure: SEQ ID NO" 79 Prote- 
in: SEQ ID NO: 80), 

sowie weitere MinD -Gene mit den folgenden Accession Nummern: 

NP_197790.1, BAA90628.1, NP_038435.1, NP_045875.1, AAN33031.1, 
NP_050910.1, CAB53105.1, NP_050687.1, NP_682807.1, NP_487496.1, 
ZP_001 11 708.1, ZP_00071 109.1, NP_442592.1, NP_603083.1, NP_782631.1, 
ZP_00097367.1, ZP_001 0431 9.1, NP_294476.1, NP_622555.1, NP_563054.l] 
NP_347881.1, ZP_001 13908.1, NP_834154.1, NP_658480.1, ZP_00059858.l] 
NP_470915.1, NP_243893.1, NP_465069.1, ZP_001 161 55.1, NP_390677.1, 
NP_692970.1, NP_298610.1, NP_207129.1, ZP_00038874.1, NP_778791.l[ 
NP_223033.1, NP_641 561.1, NP_636499.1, ZP_00088714.1, NP_213595.l! 
NP_743889.1, NP_231594.1, ZP_00085067.1, NP_797252.1, ZP_00 136593.1, 
NP_251 934. 1 , NP_405629. 1 , NP_759144. 1 , ZP_001 02939. 1 , NP_793645. 1 , 
NP_699517.1, NP_460771.1, NP_860754.1, NP_456322.1, NP_718163.1, 
NP_229666.1, NP_357356.1, NP_541904.1, NP_287414.1, NP_660660.l! 
ZP_001 28273.1, NP_103411.1, NP_785789.1, NP_715361.1, AF149810_'l, 
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NP_841854.1, NP_437893.1, ZP_p0022726.1, EAA24844.1, ZPJD0029547.1, 
NP_521484.1, NP_240148.1, NP_770852.1, AF345908_2, NP_777923.1, . 
ZPJ30048879.1, NP_579340.1, NP.J43455.1, NP_126254.1, NP__142573.1, 
NP_613505.1, NP_127112.1, NP_712786.1, NP_578214.1, NPJ369530.1, 
5 NP_247526.1, AAA85593.1, NP_212403.1, NP.782258.1, ZP_00058694.1 f 
NP_247137.1, NP_219149.1, NP_276946.1, NP_614522.1, ZP_0001 9288.1, 
CAD78330.1 

Die Erfindung betrifft ferner eine genetisch veranderte Pflanze der Gattung Tagetes, 
10 wobei die genetische Veranderung zu einer Erhohung oder Verursachung der Expres- 
sionsrate mindestens eines Gens im Vergleich zum Wildtyp fuhrt und bedingt ist durch 
die Regulation der Expression dieses Gens in der Pflanze durch die erfindungsgema- 
fien Promotoren. 

5 Wie vorstehend erwahnt, wird unter „Expressionsaktivitat" erfindungsgemaft die in ei- 
ner bestimmten Zeit durch den Promotor gebildete Menge Protein, also die Expressi- 
onsrate verstanden. 

Unter „spezifischer Expressionsaktivitat" wird erfindungsgemali die in einer bestimmten 
20 Zeit durch den Promotor gebildete Menge Protein pro Promotor verstanden. 

Bei einer „verursachten Expressionsaktivitat" oder „verursachten Expressionsrate" im 
Bezug auf ein Gen im Vergleich zum Wildtyp wird somit im Vergleich zum Wildtyp die 
Bildung eines Proteins verursacht, das im Wildtyp der Pflanze der Gattung Tagetes 
25 nicht vorhanden war. 

Beispielsweise weisen Wildtyp-Pflanzen der Gattung Tagetes kein Ketolase-Gen auf. 
Die Regulation der Expression des Ketolase-Gens in der Pflanze durch die erfindungs- 
gemafien Promotoren furht somit zu einer Verursachung der Expressionsrate. 

0 

Bei einer fl erh6hten Expressionsaktivitat" oder „erhohten Expressionsrate" im Bezug 
auf ein Gen im Vergleich zum Wildtyp wird somit im Vergleich zum Wildtyp der Pflanze 
der Gattung Tagetes in einer bestimmten Zeit die gebildete Menge des Proteins erhoht. 

35 Beispielsweise weisen Wildtyp-Pflanzen der Gattung Tagetes ein Hydroxylase-Gen 
auf. Die Regulation der Expression des Hydroxylase-Gens in der Pflanze durch die 
erflndungsgemalien Promotoren furht somit zu einer Erhohung der Expressionsrate. 

In einer bevorzugten Ausfuhrungsform der erfindungsgemSlien genetisch veranderten 
40 Pflanzen der Gattung Tagetes wird die Regulation der Expression von Genen in der 
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Pflanze durch die erfindungsgema&en Promotoren dadurch erreicht, dass man 

a) einen oder mehrere erfindungsgemalie Promotoren in das Genom der Pflanze ein- 
bnngt, so dass die Expression eines oder mehrerer endogenen Gene unter der Kon- 
trolle der eingebrachten erfindungsgemafcen Promotoren erfolgt oder 

b) ein oder mehrere Gene in das Genom der Pflanze einbringt, so dass die Expression 
eines oder mehrerer der eingebrachten Gene unter der Kontrolle der endogenen, erfin- 
dungsgemalien Promotoren erfolgt oder 

c) ein oder mehrere Nukleinsaurekonstrukte, enthaltend mindestens einen erfindungs- 
gemalXen Promotor und funktionell verknupft eine oder mehrere zu exprimierende Ge- 
ne in die Pflanze einbringt. 

In einer bevorzugten Ausfuhrungsform bringt man gemaft Merkmal c) ein oder mehrere 
Nukleinsaurekonstrukte, enthaltend mindestens einen erfindungsgemaften Promotor 
und funktionell verknupft eine oder mehrere zu exprimierende Gene, in die Pflanze ein 
Die Integration der Nukleinsaurekonstrukte in der Pflanze der Gattung Tagetes kann 
dabei intrachromosomal oder extrachromosomal erfolgen. 

Bevorzugte erfindungsgemafce Promotoren und bevorzugte zu exprimierende Gene 
(Effektgene) sind vorstehend beschrieben. 

Im folgenden wird exemplarisch die Herstellung der genetisch veranderten Pflanzen 
der Gattung Tagetes mit erhohter oder verursachter Expressionsrate eines Effektgens 
beschrieben. 

Die Transformation kann bei den Kombinationen von genetischen Veranderungen ein- 
zeln oder durch Mehrfachkonstrukte erfolgen. 

Die Herstellung der transgenen Pflanzen erfolgt vorzugsweise durch Transformation 
der Ausgangspflanzen, mit einem Nukleinsaurekonstrukt, das mindestens einen der 
vorstehend beschriebenen, erfindungsgemaften Promotoren enthalt, die mit einem zu 
expnm.erenden Effektgen und gegebenenfalls weiteren Regulationssignalen funktionell 
verknupft sind. 

Diese Nukleinsaurekonstrukte, in denen die erfindungsgemaRen Promotoren und Ef- 
fektgene funktionell verknupft sind, werden im folgenden auch Expressionskassetten 
genannt. 
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Die Expressionskassetten konnen weitere Regulationssignale enthalten, also regulati- 
ve Nukleinsauresequenzen, welche die Expression der Effektgene in der Wirtszelle 
steuern. Gemali einer bevorzugten Ausftihrungsform umfasst eine Expressionskasset- 
te stromaufwarts, d.h. am 5'-Ende der kodierenden Sequenz, mindestens einen erfin- 
5 dungsgemalien Promotor und stromabwarts, d.h. am 3-Ende, ein Polyadenylierungs- 
signal und gegebenenfalls weitere regulatorische Elemente, welche mit der dazwi- 
schenliegenden kodierenden Sequenz des Effektgens fQr mindestens eines der vor- 
stehend beschriebenen Gene operativ verknQpft sind. 

10 Unter einer operativen VerknQpfung versteht man die sequenzielle Anordnung von 
Promotor, kodierender Sequenz, Terminator und ggf. weiterer regulativer Elemente 
derart, das jedes der regulativen Elemente seine Funktion bei der Expression der ko- 
dierenden Sequenz bestimmungsgemafS erfQIIen kann. 

•15 Im folgenden werden beispielhaft die bevorzugten Nukleinsaurekonstrukte, Expressi- 
) onskassetten und Vektoren fur Pflanzen und Verfahren zur Herstellung von transgenen 
Pflanzen, sowie die transgenen Pflanzen der Gattung Tagetes selbst beschrieben. 

Die zur operativen VerknQpfung bevorzugten, aber nicht darauf beschrankten Sequen- 
20 zen, sind Targeting-Sequenzen zur Gewahrleistung der subzellularen Lokalisation im 
Apoplasten, in der Vakuole, in Plastiden, im Mitochondrium, im Endoplasmatischen 
Retikulum (ER), im Zellkern, in Olkorperchen oder anderen Kompartimenten und 
Translationsverstarkern wie die 5'-Fuhrungssequenz aus dem Tabak-Mosaik-Virus 
(Gallie etal., Nucl. Acids Res. 15 (1987), 8693 -8711). 

25 

Die Herstellung einer Expressionskassette erfolgt vorzugsweise durch Fusion mindes- 
tens eines erfindungsgema&en Promotors mit mindestens einem Gen, vorzugsweise 
mit einem der vorstehend beschriebenen Effektgene, und vorzugsweise einer zwischen 

• Promotor und Nukleinsaure-Sequenz inserierten Nukleinsaure, die fur ein plastiden- 
0 spezifisches Transitpeptid kodiert, sowie einem Polyadenylierungssignal nach gangi- 
gen Rekombinations- und Klonierungstechniken, wie sie beispielsweise in T. Maniatis, 
E.F. Fritsch und J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring 
Harbor Laboratory, Cold Spring Harbor, NY (1989) sowie in T.J. Silhavy, M.L. Berman 
und L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, 
35 Cold Spring Harbor, NY (1984) und in Ausubel, F.M. et al.. Current Protocols in Mole- 
cular Biology, Greene Publishing Assoc. and Wiley-lnterscience (1987), beschrieben 
sind. 
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Die vorzugsweise insertierte Nukleinsauren, kodierend ein plastidares Transitpeptid, 
gewahrleisten die Lokalisation in Plastiden und insbesondere in Chromoplasten. 

Es konnen auch Expressionskassetten verwendet werden, deren Nukleinsaure- 
Sequenzfiir ein Effektgen-Produkt-Fusionsprotein kodiert, wobei ein Teil des Fusions- 
proteins ein Transitpeptid ist, das die Translokation des Polypeptides steuert. Bevor- 
zugt sind fur die Chromoplasten spezifische Transitpeptide, welche nach Translokation 
der Effektgene in die Chromoplasten vom Effektgenprodukt-Teil enzymatisch ab- 
gespalten werden. 



Insbesondere bevorzugt ist das Transitpeptid, das von der plastidaren Nicotiana taba- 
cum Transketolase oder einem anderen Transitpeptid (z.B. dem Transitpeptid der klei- 
nen Untereinheit der Rubisco (rbcS) oder der Ferredoxin NADP Oxidoreduktase als 
auch der Isopentenylpyrophosphat lsomerase-2 oder dessen funktionellem Aquivalent 
abgeleitet ist. 



Besonders bevorzugt sind Nukleinsaure-Sequenzen von drei Kassetten des Plastiden- 
Transitpeptids der plastidaren Transketolase aus Tabak in drei Leserastem als 
Kpnl/BamHI Fragmente mit einem ATG-Codon in der Ncol Schnittstelle: 

pTP09 

Kpnl_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTC 

GTT CTGTC CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT- 

CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG- 

TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC- 

GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGG- 
GATCC_BamHI 

pTP10 

KpnLGGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTC 

G ^ CTGTC C CTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT- 

CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG- 

TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC- 

GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGCTG- 
GATCC_BamHI 



pTP11 
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Kpnl_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTC 

GTT CTGTC CCTCGCCATGGCTCTGCCTCTTCTTCTCAAC-nTCCCCTTCrrCTCT- 

CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG- 

TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC- 

GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGGG- 
GATCC_BamHI 

Weitere Beispiele fur ein plastidares Transitpeptid sind das Transitpeptid der plastida- 
ren Isopentenyl-pyrophosphat lsomerase-2 (IPP-2) aus Arabisopsis thaliana und das 
Transitpeptid derkieinen Untereinheit der Ribulosebisphosphat Carboxylase (rbcS) aus 
Erbse (Guerineau, F, Woolston, S, Brooks, L, Mullineaux, P (1988) An expression cas- 
sette for targeting foreign proteins into the chloroplasts. Nucl. Acids Res. 16: 11380). 

Die erfindungsgemaften Nukleinsauren konnen synthetisch hergestellt oder natOrlich 
gewonnen sein oder eine Mischung aus synthetischen und naturlichen Nukleinsaure- 
Bestandteilen enthalten, sowie aus verschiedenen heterologen Genabschnitten ver- 
schiedener Organismen bestehen. 

Bevorzugt sind, wie vorstehend beschrieben, synthetische Nukleotid-Sequenzen mit 
Kodons, die von Pflanzen bevorzugt werden. Diese von Pflanzen bevorzugten Kodons 
kfinnen aus Kodons mit der hdchsten Proteinhaufigkeit bestimmt werden, die in den 
meisten interessantenPflanzenspezies exprimiert werden. 

Bei der Preparation einer Expressionskassette konnen verschiedene DNA-Fragmente 
manipuliert werden, um eine Nukleotid-Sequenz zu erhalten, die zweckmalJigerweise 
in der korrekten Richtung liest und die mit einem korrekten Leseraster ausgestattet ist. 
Fur die Verbindung der DNA-Fragmente miteinander kSnnen an die Fragmente Adap- 
toren oder Linker angesetzt werden. 

Zweckmaftigerweise k6nnen die Promotor- und die Terminator-Regionen in Transkrip- 
tionsrichtung mit einem Linker oder Poiylinker, der eine oder mehrere Restriktionsstel- 
len fur die Insertion dieser Sequenz enthalt, versehen werden. In der Regel hat der 
Linker 1 bis 10, meistens 1 bis 8, vorzugsweise 2 bis 6 Restriktionsstellen. Im allge- 
meinen hat der Linker innerhalb der regulatorischen Bereiche eine Grofte von weniger 
als 100 bp, haufig weniger als 60 bp, mindestens jedoch 5 bp. Der Promotor kann so- 
wohl nativ bzw. homolog als auch fremdartig bzw. heterolog zur Wirtspflanze sein. Die 
Expressionskassette beinhaltet vorzugsweise in der 5'-3'-Transkriptionsrichtung den 
Promotor, eine kodierende Nukleinsauresequenz oder ein Nukleinsaurekonstrukt und 
eine Region fur die transkriptionale Termination. Verschiedene Terminationsbereiche 
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sind gegeneinander beliebig austauschbar. 



Beispiele fOr einen Terminator sind der 35S-Terminator (Guerineau et al. (1988) Nucl 
Acids Res. 16: 11380), der nos Terminator (Depicker A, Stachel S, Dhaese P, 
Zambryski P, Goodman HM. Nopaline synthase: transcript mapping and DNA sequen- 
ce. J Mol Appl Genet. 1982;1(6):561-73) Oder der ocs Terminator (Gielen, J, de 
Beuckeleer, M, Seurinck, J, Debroek, H, de Greve, H, Lemmers, M, van Montagu, M, 
Schell, J (1 984) The complete sequence of the TL-DNA of the Agrobacterium 
tumefaciens plasmid pTiAch5. EMBO J. 3: 835-846). 

Ferner konnen Manipulationen, die passende Restriktionsschnittstellen bereitstelien 
oder die Oberflussige DNA oder Restriktionsschnittstellen entfemen, eingesetzt wer- 
den. Wo Insertionen, Deletionen oder Substitutionen wie z.B. Transitionen und Trans- 
versionen in Frage kommen, konnen in v/fro-Mutagenese, "primer-repair", Restriktion 
oder Ligation verwendet werden. 



Bei geeigneten Manipulationen, wie z.B. Restriktion, "chewing-back" oder Auffullen von 
Oberhangen fur "bluntends", konnen komplementare Enden der Fragmente fur die Li- 
gation zur Verfugung gestellt werden. 

Bevorzugte Polyadenylierungssignale sind pflanzliche Polyadenylierungssignale, vor- 
zugsweise solche, die Im wesentlichen T-DNA-Polyadenylierungssignale aus Agrobac- 
terium tumefaciens, insbesondere des Gens 3 der T-DNA (Octopin Synthase) des Ti- 
Plasmids pTiACH5 entsprechen (Gielen et al., EMBO J. 3 (1984), 835 ff) oder funktio- 
nelle Aquivalente. 

Die Obertragung von Fremdgenen in das Genom einer Pflanze wird als Transformation 
bezeichnet. 



Dazu kdnnen an sich bekannte Methoden zur Transformation und Regeneration von 
Pflanzen aus Pflanzengeweben oder Pflanzenzellen zur transienten oder stabilen 
Transformation genutzt werden. 



Geeignete Methoden zur Transformation von Pflanzen sind die Protoplastentransfor- 
mation durch Polyethylenglykol-induzierte DNA-Aufnahme, das biolistische Verfahren 
mit der Genkanone - die sogenannte "particle bombardment" Methode, die Elektropo- 
ration, die Inkubation trockener Embryonen in DNA-haltiger Losung, die Mikroinjektion 
und der, vorstehend beschriebene, durch Agrobacterium vermittelte Gentransfer. Die 
genannten Verfahren sind beispielsweise in B. Jenes et al., Techniques for Gene 
Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, herausgegeben von 
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S.D. Kung und R. Wu, Academic Press (1993), 128-143 sowie in Potrykus, Annu Rev 
Plant Physiol. Plant Molec. Biol. 42 (1991), 205-225) beschrieben. 

Vorzugsweise wird das zu exprimierende Konstrukt in einen Vektor kloniert, der geeig- 
net .st, Agrobacterium tumefaciens zu transformieren, beispielsweise P Bin19 (Bevan 
et al., Nucl. Acids Res. 12 (1984), 871 1) oder besonders bevorzugt pSUN2 pSUN3 
pSUN4 oder pSUN5 (WO 02/00900). 

Mit einem Expressionsplasmid transformierte Agrobakterien konnen in bekannter Wei- 
se zur Transformation von Pflanzen verwendet werden, z.B. indem verwundete Blatter 
oder Blattstucke in einer Agrobakterienlosung gebadet und anschlielSend in geeigneten 
Medien kultiviert werden. 

Zur bevorzugten Herstellung von genetisch veranderten Pflanzen, im folgenden auch 
transgene Pflanzen bezeichnet, wird die fusionierte Expressionskassette in einen Vek- 
tor, be.spielsweise P Bin19 oder insbesondere pSUNS und pSUN3 kloniert, der geeig- 
net .st, in Agrobacterium tumefaciens transformiert zu werden. Mit einem solchen Vek- 
tor transformierte Agrobakterien konnen dann in bekannter Weise zur Transformation 
von Pflanzen, insbesondere von Kulturpflanzen verwendet werden, indem beispiels- 
weise verwundete Blatter oder Blattstucke in einer Agrobakterienlosung gebadet 
und anschheliend in geeigneten Medien kultiviert werden. 

Die Transformation von Pflanzen durch Agrobakterien ist unter anderem bekannt aus 
F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants Vol 1 
Eng.neer.ng and Utilization, herausgegeben von S.D. Kung und R. Wu, Academic ' 
Press, 1993, S. 15-38. Aus den transformierten Zellen der verwundeten Blatter bzw 
Blattstucke konnen in bekannter Weise transgene Pflanzen regeneriert werden, die ein 
oder mehrere in die Expressionskassette integrierte Gene enthalten. 

Zur Transformation einer Wirtspflanze mit einem oder mehreren erfindungsgemafien 
Effektgenen wird eine Expressionskassette als Insertion in einen rekombinanten Vektor 
emgebaut, dessen Vektor-DNA zusatzliche funktionelle Regulationssignale, beispiels- 
we.se Sequenzen fur Replikation oder Integration enthalt. Geeignete Vektoren sind 
unter anderem in "Methods in Plant Molecular Biology and Biotechnology" 
(CRC Press), Kap. 6/7, S. 71-1 1 9 (1 993) beschrieben. 

Unter Verwendung der oben zitierten Rekombinations- und Klonierungstechniken kon- 
nen die Expressionskassetten in geeignete Vektoren kloniert werden, die ihre Vermeh- 
rung, be.spielsweise in E. coli, ermoglichen. Geeignete Klonierungsvektoren sind u a 
PJIT1 17 (Guerineau et al. (1988) Nucl. Acids Res.16 :1 1380), pBR332 pUC-Serien 
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M13mp-Serien und pACYC184. Besonders geeignet sind binare Vektoren, die sowohl 
in E. coli als auch in Agrobakterien replizieren konnen. 

Die Erfindung betrifft daher weiterhin eine genetisch veranderte Pflanze der Gattung 
5 Tagetes, enthaltend einen erfindungsgemaUen Promotor und funktionell verknupft ein 
zu eprimierendes Gen, mit der Maligabe, dass Gene aus Pflanzen der Gattung Tage- 
tes, die in Wildtyppflanzen der Gattung Tagetes von dem jeweiligen Promotor expri- 
miert werden, ausgenommen sind. 

10 Bevorzugte erfindungsgemafie Promotoren und bevorzugte Effektgene sind vorste- 
hend beschrieben. 

Insbesondere bevorzugt sind Effektgene ausgewShlt sind aus der Gruppe Nukleinsau- 
ren, kodierend eine Ketolase, Nukleinsauren kodierend eine ^-Hydroxylase, Nuklein- 

•5 sauren kodierend eine 0-Cyclase, Nukleinsauren kodierend eine e-Cyclase, Nuklein- 
sauren kodierend eine Epoxidase, Nukleinsauren kodierend eine HMG-CoA- 
Reduktase, Nukleinsauren kodierend eine (E)-4-Hydroxy-3-Methylbut-2-enyl- 
Diphosphat-Reduktase, Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5-Phosphat- 
Synthase, Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5-Phosphat- 
20 Reduktoisomerase, Nukleinsauren kodierend eine Isopentenyi-Diphosphat-A- 

Isomerase, Nukleinsauren kodierend eine Geranyl-Diphosphat-Synthase, Nukleinsau- 
ren kodierend eine Farnesyl-Diphosphat-Synthase, Nukleinsauren kodierend eine Ge- 
ranyl-Geranyl-Diphosphat-Synthase, Nukleinsauren kodierend eine Phytoen-Synthase, 
Nukleinsauren kodierend eine Phytoen-Desaturase, Nukleinsauren kodierend eine 
25 Prephytoen-Synthase, Nukleinsauren kodierend eine Zeta-Carotin-Desaturase, Nuk- 
leinsauren kodierend ein crtlSO Protein, Nukleinsauren kodierend ein FtsZ Protein und 
Nukleinsauren kodierend ein MinD Protein. 

•| Bevorzugte, genetisch veranderte Pflanzen der Gattung Tagetes sind Marigold, Tage- 
30 tes erecta, Tagetes patula, Tagetes lucida, Tagetes pringlei, Tagetes palmeri, Tagetes 
minuta oder Tagetes campanulata. 

Durch die erfindungsgemafien Promotoren ist es mit Hilfe der vorstehend beschriebe- 
nen, erfindungsgema&en Verfahren mOglich, in den vorstehend beschriebenen, erfin- 
35 dungsgemafien genetisch veranderten Pflanzen der Gattung Tagetes die Stoffwech- 
selwege zu spezifischen biosynthetischen Produkten zu regulieren. 



40 



Dazu werden beispielsweise Stoffwechselwege, die zu einem spezifischen biosyntheti- 
schen Produkt fuhren, durch Verursachung oder Erhohung der Transkriptionrate bzw. 
Expressionsrate von Genen dieses Biosyntheseweges verstSrkt, indem die erhohte 
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Proteinmenge zu einer erhohten Gesarntaktivitat dieser Proteine des gewGnschten 
Biosyntheseweges und damit durch einem verstarkten StoffwechselflulJ zu dem ge- 
wiinschen biosynthetischen Produkt fuhrt 

5 Je nach gewunschtem biosynthetischen Produkt muss die Transkriptionsrate bzw. Ex- 
pressionsrate verschiedener Gene erhoht bzw. reduziert werden. In der Regel ist es 
vorteilhaft, die Transkrioptionsrate bzw. Expressionsrate mehrere Gene zu verandern, 
d.h. die Transkrioptionsrate bzw. Expressionsrate einer Kombination von Gene zu Er- 
hohen und/oder die Transkrioptionsrate bzw. Expressionsrate einer Kombination von 

10 Gene zu reduzieren. 

In den erfindungsgemaften genetisch veranderten Pflanzen ist mindestens eine erhoh- 
te Oder verursachte Expressionsrate eines Gens auf einen erfindungsgema&en Promo- 
tor zurtickzufuhren. 

* Weitere, zusatzliche veranderte, d.h. zusatzlich erhohte oder zusatzlich reduzierte Ex- 
pressionsraten von weiteren Genen in genetisch veranderten Pflanzen konnen, mus- 
sen aber nicht auf die erfindungsgemaften Promotoren zuruck gehen. 

20 Die Erfindung betrifft daher ein Verfahren zur Herstellung von biosynthetischen Produk- 
ten durch Kultivierung von erfindungsgemalien, genetisch veranderten Pflanzen der 
Gattung Tagetes. 

Die Erfindung betrifft insbesondere ein Verfahren zur Herstellung von Carotinoiden 
25 durch Kultivierung von erfindungsgemalJen genetisch veranderten Pflanzen der Gat- 
tung Tagetes, dadurch gekennzeichnet, dass die zu exprimierenden Gene ausgewahlt 
sind aus der Gruppe Nukleinsauren, kodierend eine Ketolase, Nukleinsauren kodierend 
eine p-Hydroxylase, Nukleinsauren kodierend eine p-Cyclase, Nukleinsauren kodie- 
rend eine e-Cyclase, Nukleinsauren kodierend eine Epoxidase, Nukleinsauren kodie- 
30 rend eine HMG-CoA-Reduktase, Nukleinsauren kodierend eine (E)-4-Hydroxy-3- 
Methylbut-2-enyl-Diphosphat-Reduktase, Nukleinsauren kodierend eine 1-Deoxy-D- 
Xylose-5-Phosphat-Synthase, Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5- 
Phosphat-Reduktoisomerase, Nukleinsauren kodierend eine Isopentenyl-Diphosphat- 
A-lsomerase, Nukleinsauren kodierend eine Geranyl-Diphosphat-Synthase, Nuklein- 
35 sauren kodierend eine Farnesyl-Diphosphat-Synthase, Nukleinsauren kodierend eine 
Geranyl-Geranyi-Diphosphat-Synthase, Nukleinsauren kodierend eine Phytoen- 
Synthase, Nukleinsauren kodierend eine Phytoen-Desaturase, Nukleinsauren kodie- 
rend eine Prephytoen-Synthase, Nukleinsauren kodierend eine Zeta-Carotin- 
Desaturase, Nukleinsauren kodierend ein crtlSO Protein, Nukleinsauren kodierend ein 
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FtsZ Protein und Nukleinsauren kodierend ein MinD Protein. 

Die Carotinoide sind vorzugsweise ausgewahlt aus der Gruppe Phytoen, Phytofluen, 
Lycopin, Lutein, Zeaxanthin, Astaxanthin, Canthaxanthin, Echinenon, 3- 
5 Hydroxyechinenon, 3'-Hydroxyechinenon, Adonirubin, Violaxanthin und Adonixanthin. 

Insbeondere betrifft die Erfindung weiterhin ein Verfahren zur Herstellung von Ketoca- 
rotinoiden durch Kultivierung von erfindungsgemaften genetisch veranderten Pflanzen 
der Gattung Tagetes, dadurch gekennzeichnet, dass die zu exprimierenden Gene 
1 0 ausgewahlt sind aus der Gruppe Nukleinsauren, kodierend eine Ketolase, 

Nukleinsauren kodierend eine (J-Hydroxylase, Nukleinsauren kodierend eine p- 
Cyclase, Nukleinsauren kodierend eine e-Cyclase, Nukleinsauren kodierend eine 
Epoxidase, Nukleinsauren kodierend eine HMG-CoA-Reduktase, Nukleinsauren 
kodierend eine (E)-4-Hydroxy-3-Methylbut-2-enyl-Diphosphat-Reduktase, 

•5 Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5-Phosphat-Synthase, Nukleinsauren 
kodierend eine 1-Deoxy-D-Xylose-5-Phosphat-Reduktoisomerase, Nukleinsauren 
kodierend eine Isopentenyl-Diphosphat-A-isomerase, Nukleinsauren kodierend eine 
Geranyl-Diphosphat-Synthase, Nukleinsauren kodierend eine Farnesyl-Diphosphat- 
Synthase, Nukleinsauren kodierend eine Geranyl-Geranyl-Diphosphat-Synthase, 
20 Nukleinsauren kodierend eine Phytoen-Synthase, Nukleinsauren kodierend eine 
Phytoen-Desaturase, Nukleinsauren kodierend eine Prephytoen-Synthase, 
Nukleinsauren kodierend eine Zeta-Carotin-Desaturase, Nukleinsauren kodierend ein 
crtlSO Protein, Nukleinsauren kodierend ein FtsZ Protein und Nukleinsauren kodierend 
ein MinD Protein. 

25 Die Ketocarotinoide sind vorzugsweise ausgewahlt aus der Gruppe Astaxanthin, 
Canthaxanthin, Echinenon, 3-Hydroxyechinenon, 3'-Hydroxyechinenon, Adonirubin, 
Violaxanthin und Adonixanthin. 

•| I" 1 erfindungsgemalien Verfahren zur Herstellung von biosynthetischen Produkten, 
30 insbesondere Carotinoiden, vorzugsweise Ketocarotinoiden, wird vorzugsweise dem 
Kultivierungsschritt der genetisch veranderten Pflanzen ein Ernten der Pflanzen und 
ein Isolieren der biosynthetischen Produkte, insbesondere Carotinoide, vorzugsweise 
Ketocarotinoide aus den Pflanzen, vorzugsweise aus den Petalen der Pflanzen, ange- 
schlossen. 

35 

Die genetisch veranderten Pflanzen der Gattung Tagetes werden in an sich bekannter 
Weise auf Nahrboden gezogen und entsprechend geerntet. 

Die Isolierung von Ketocarotinoiden aus den geernteten BIQtenblattern erfolgt bei- 
40 spielsweise in an sich bekannter Weise, beispielsweise durch Trocknung und an- 
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schlieRender Extraktion und gegebenenfalls weiterer chemischer oder physikalischer 
Reinigungsprozesse, wie beispielsweise Fallungsmethoden, Kristallographie, thermi- 
sche Trennverfahren, wie Rektifizierverfahren Oder physikalische Trennverfahren, wie 
beispielsweise Chromatographic. Die Isolierung von Ketocarotinoiden aus den Bluten- 
blattern erfolgt beispielsweise bevorzugt durch organische Losungsmittel wie Aceton, . 
Hexan, Heptan, Ether oder tert.-Methylbutylether. 

Weitere Isolierverfahren von Ketocarotinoiden, insbesondere aus Blutenblattern, sind 
beispielsweise in Egger und Kleinig (Phytochemistry (1967) 6 f 437-440) und Egger 
(Phytochemistry (1965) 4, 609-618) beschrieben. 

Ein besonders bevorzugtes Ketocarotinoid ist Astaxanthin. 

Die Ketocarotinoide fallen im erfindungsgemafien Verfahren in Blutenblattern in Form 
ihrer Mono- oder Diester mit Fettsauren an. Einige nachgewiesene Fettsauren sind z.B. 
Myristinsaure, Palmitinsaure, Stearinsaure, Olsaure, Linolensaure, und Laurinsaure 
(Kamata und Simpson (1987) Comp. Biochem. Physiol. Vol. 86B(3), 587-591). 

Von Menschen und Tieren verzehrbare erfindungsgemafce, genetisch verSnderte 
Pflanzen oder Pflanzenteile, wie insbesondere Blutenblatter mit erhohtem Gehalt an 
biosynthetischen Produkten, insbesondere Carotinoide, insbesondere Ketocarotinoide, 
insbesondere Astaxanthin, konnen auch beispielsweise direkt oder nach an sich be- 
kannter Prozessierung als Nahrungsmittel oder Futtermittel oder als Futter- und Nah- 
rungserganzungsmittel verwendet werden. 

Ferner konnen die genetisch veranderten Pflanzen zur Herstellung von biosyntheti- 
schen Produkt-, insbesondere Carotinoid-, insbesondere Ketocarotinoid-, insbesondere 
Astaxanthin-haltigen Extrakten und/oder zur Herstellung von Futter- und Nahrungser- 
ganzungsmitteln sowie von Kosmetika und Pharmazeutika verwendet werden. 

Die genetisch veranderten Pflanzen der Gattung Tagetes weisen im Vergleich zum 
Wildtyp einen erhohten Gehalt an dem gewunschten biosynthetischen Produkten, ins- 
besondere Carotinoide, insbesondere Ketocarotinoide, insbesondere Astaxanthin auf. 

Unter einem erhohten Gehalt wird in diesem Fall auch ein verursachter Gehalt an Ke- 
tocarotinoiden, bzw. Astaxanthin verstanden. 

Die Erfindung wird durch die nun folgenden Beispiele erlautert, ist aber nicht auf diese 
beschrankt: 
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Allgemeine Experimentelle Bedingungen: 
Sequenzanalyse rekombinanter DNA 

Die Sequenzierung rekombinanter DNA-Molekule erfolgte mit einem Laserfluoreszenz- 
5 DNA-Sequenzierer der Firma Licor (Vertrieb durch MWG Biotech, Ebersbach) nach der 
Methode von Sanger (Sanger et al., Proc. Natl. Acad. Sci. USA 74 (1977), 5463-5467). 

Beispiel 1: 

Amplifikation einer DNA, die die gesamte Primarsequenz der NOST-Ketolase aus 
1 0 Nostoc sp. PCC 7120 kodiert 

Die DNA, die fur die NOST-Ketolase aus Nostoc sp. PCC 7120 kodiert, wurde mittels 
PCR aus Nostoc sp. PCC 7120 (Stamm der "Pasteur Culture Collection of Cyanobac- 
terium") amplifiziert. 

•I 5 
f Fur die Praparation von genomischer DNA aus einer Suspensionskultur von Nostoc sp. 

PCC 7120, die 1 Woche mit Daueriicht und konstantem Schutteln (150 rpm) at 25°C in 
BG f f -Medium (1.5 g/l NaN03, 0.04 g/l K2P04x3H20, 0.075 g/l MgS04xH20, 0.036 
g/l CaCI2x2H20, 0.006 g/l citric acid, 0.006 g/l Ferric ammonium citrate, 0.001 g/l ED- 
20 TA disodium magnesium, 0.04 g/l Na2C03, 1 ml trace metal mix A5+Co (2.86 g/l 

H3B03, 1.81 g/l MnCI2x4H2o, 0.222 g/l ZnSO4x7H2o,0.39 g/l NaMo04X2H2o, 0.079 
g/l CuS04x5H20, 0.0494 g/l Co(N03)2x6H20)) gewachsen war, wurden die Zellen 
durch Zentrifugation geerntet, in flOssigem Stickstoff eingefroren und im Moreerpulve- 
risiert. 

25 

Protokoll fur DNA Isolation aus Nostoc PCC7120: 

Aus einer 10 ml Flussigkultur wurden die Bakterienzellen durch 10minutige Zentrifuga- 

• tion bei 8 000 rpm pelletiert. Anschlieliend wurden die Bakterienzellen in fiussigem 
30 Stickstoff mit einem Morser zerstoBen und gemahlen. Das Zellmaterial wurde in 1 ml 
10mM Tris HCI (pH 7.5) resuspendiert und in ein Eppendorf Reaktionsgefali (2ml Vo- 
lumen) QberfOhrt. Nach Zugabe von 100 pi Proteinase K (Konzentration: 20 mg/ml) 
wurde die Zellsuspension fOr 3 Stunden bei 37°C inkubiert. Anschlieliend wurde die 
Suspension mit 500 pi Phenol extrahiert Nach 5min0tiger Zentrifugation bei 13 000 
35 upm wurde die obere, wassrige Phase in ein neues 2 ml-Eppendorf Reaktionsgefali 
QberfOhrt. Die Extraktion mit Phenol wurde 3mal wiederholt. Die DNA wurde durch Zu- 
gabe von 1/10 Volumen 3 M Natriumacetat (pH 5.2) und 0.6 Volumen Isopropanol ge- 
fallt und anschliefiend mit 70% Ethanol gewaschen. Das DNA-Pellet wurde bei Raum- 
temperatur getrocknet, in 25 pi Wasser aufgenommen und unter Erhitzung auf 65°C 
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gelost. 

Die Nukieinsaure, kodierend eine Ketolase aus Nostoc PCC 7120, wurde mittels "po- 
lymerase chain reaction" (PCR) aus Nostoc sp. PCC 7120 unter Verwendung eines 
5 sense-spezifischen Primers (NOSTF, SEQ ID No. 79) und eines antisense- 
spezifischen Primers (NOSTG SEQ ID No. 80) amplifiziert. 

Die PCR-Bedingungen waren die folgenden: 

1 0 Die PCR zur Amplifikation der DNA, die fur ein Ketolase Protein bestehend aus der 
gesamten Primarsequenz kodiert, erfolgte in einem 50 ul Reaktionsansatz, in dem ent- 
halten war: 

- 1 ul einer Nostoc sp. PCC 7120 DNA (hergestellt wie oben beschrieben) 
tf5 -0.25mMdNTPs 

- 0.2 mM NOSTF (SEQ ID No. 79) 

- 0.2 mM NOSTG (SEQ ID No. 80) 

- 5 ul 10X PCR-Puffer (TAKARA) 

- 0.25 ul R Taq Polymerase (TAKARA) 
20 - 25.8 ul Aq. Dest. 

Die PCR wurde unter folgenden Zyklusbedingungen durchgefOhrt: 

1X94°C 2 Minuten 
25 35X94°C 1 Minute 
55°C 1 Minuten 
72°C 3 Minuten 
1X72°C 10 Minuten 

r 30 Die PCR-Amplifikation mit SEQ ID No. 79 und SEQ ID No. 80 resultierte in einem 805 
Bp-Fragment, das fur ein Protein bestehend aus der gesamten Primarsequenz kodiert 
(SEQ ID No. 81). Unter Verwendung von Standardmethoden wurde das Amplifikat in 
den PCR-Klonierungsvektor pGEM-T (Promega) kloniert und der Klon pNOSTF-G er- 
halten. 

35 

Sequenzierung des Klons pNOSTF-G mit dem M13F- und dem M13R-Primer bestatig- 
te eine Sequenz, welche mit der DNA-Sequenz von 88,886-89,662 des Datenbankein- 
trages AP003592 identisch ist. Diese Nukieotidsequenz wurde in einem unabhangigem 
Amplifikationsexperiment reproduziert und reprasentiert somit die Nukieotidsequenz im 
40 verwendeten Nostoc sp. PCC 7120. 
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Beispiel 2 

Amplifikation einer DNA, die die gesamte Primarsequenz der NP196-Ketolase aus 
Nostoc punctiforme ATCC 29133 kodiert 

Die DNA, die fur die NP1 96-Ketolase aus Nostoc punctiforme ATCC 29133 kodiert 
wurde mittels PCR aus Nostoc punctiforme ATCC 29133 (Stamm der "American Type 
Culture Collection") amplifiziert. 

FOr die Preparation von genomischer DNA aus einer Suspensionskultur von Nostoc 
punctiforme ATCC 29133, die 1 Woche mit Dauerlicht und konstantem SchQtteln (150 
rpm) at 25°C in BG f 7-Medium (1.5 g/l NaN0 3f 0.04 g/l K 2 P04X3H 2 0, 0 075 g/l 
MgS04xH 2 0, 0.036 g/l CaC! 2 x2H 2 0, 0.006 g/l citric acid, 0.006 g/l Ferric ammonium 
citrate, 0.001 g/l EDTA disodium magnesium, 0.04 g/l Na 2 C0 3 , 1ml Trace Metal Mix 
"A5 + Co" (2.86 g/l H 3 B0 3 , 1.81 g/l MnCI 2 x4H 2 o, 0.222 g/l ZnSCW^O, 0.39 g/l Na- 
Mo04X2H 2 o, 0.079 g/l CuS0 4 x5H 2 0, 0.0494 g/l Co(N0 3 ) 2 x6H 2 0)) gewachsen war 
wurden die Zellen durch Zentrifugation geerntet, in flOssigem Stickstoff eingefroreri und 
im Morser pulverisiert. 

Protokoll fQr die DNA-lsolation aus Nostoc punctiforme ATCC 29133: 

Aus einer 10 ml Flussigkultur wurden die Bakterienzellen durch 10 minOtige Zentrifuga- 
tion bei 8000 rpm pelletiert. Anschlieliend wurden die Bakterienzellen in flOssigem 
Stickstoff mit einem Morser zerstolien und gemahlen. Das Zellmaterial wurde in 1 ml 
10mM Tris-HCI (pH 7.5) resuspendiert und in ein Eppendorf-ReaktionsgefaR (2ml Vo- 
lumen) uberfuhrt Nach Zugabe von 100 pi Proteinase K (Konzentration: 20 mg/ml) 
wurde die Zellsuspension fOr 3 Stunden bei 37°C inkubiert. Anschlieliend wurde die 
Suspension mit 500 pi Phenol extrahiert. Nach 5minutiger Zentrifugation bei 13 000 
upm wurde die obere, wassrige Phase in ein neues 2 ml-Eppendorf-Reaktionsgefali 
uberfuhrt. D.e Extraktion mit Phenol wurde 3mal wiederholt. Die DNA wurde durch Zu- 
gabe von 1/10 Volumen 3 M Natriumacetat (pH 5.2) und 0.6 Volumen Isopropanol ge- 
fallt und anschlieliend mit 70% Ethanol gewaschen. Das DNA-Pellet wurde bei Raum- 
temperatur getrocknet, in 25 pi Wasser aufgenommen und unter Erhitzung auf 65°C 
gelost. 

Die Nukleinsaure, kodierend eine Ketolase aus Nostoc punctiforme ATCC 29133 wur- 
de mittels "polymerase chain reaction" (PCR) aus Nostoc punctiforme ATCC 29133 
unter Verwendung eines sense-spezifischen Primers (NP196-1, SEQ ID No. 82) und 
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eines antisense-spezifischen Primers (NP196-2 SEQ ID No. 83) amplifiziert. 
Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplifikation der DNA, die fQr ein Ketolase Protein bestehend aus der 
gesamten Primarsequenz kodiert, erfolgte in einem 50 ul Reaktionsansatz, in dem ent- 
halten war: 

- 1 ul einer Nostoc punctiforme ATCC 29133 DNA (hergestellt wie oben beschrieben) 

- 0.25 mM dNTPs 

- 0.2 mM NP196-1 (SEQ ID No. 82) 

- 0.2 mM NP196-2 (SEQ ID No. 83) 

- 5 ul 10X PCR-Puffer (TAKARA) 

- 0.25 ul R Taq Polymerase (TAKARA) 

- 25.8 ul Aq. Dest. 

Die PCR wurde unter folgenden Zyklusbedingungen durchgefuhrt: 

1X94°C 2 Minuten 
35X 94°C 1 Minute 

55°C 1 Minuten 

72°C 3 Minuten 
1X72°C 10 Minuten 

Die PCR-Amplifikation mit SEQ ID No. 82 und SEQ ID No. 83 resultierte in einem 792 
Bp-Fragment, das fur ein Protein bestehend aus der gesamten Primarsequenz kodiert 
(NP196, SEQ ID No. 84). Unter Verwendung von Standardmethoden wurde das Ampli- 
fikat in den PCR-Klonierungsvektor pCR 2.1 (Invitrogen) kloniert und der Klon pNP196 
erhalten. 

Sequenzierung des Klons pNP196 mit dem M13F- und dem M13R-Primer bestatigte 
eine Sequenz, welche mit der DNA-Sequenz von 140.571-139.810 des Datenbank- 
eintrages NZ_AABC01000196 identisch ist (inverse orientiert zum ver5ffentlichen Da- 
tenbankeintrag) mit der Ausnahme, daft G in Position 140.571 durch A ersetzt wurde, 
urn ein Standard-Startkodon ATG zu erzeugen. Diese Nukleotidsequenz wurde in ei- 
nem unabhangigem Amplifikationsexperiment reproduziert und reprasentiert somit die 
Nukleotidsequenz im verwendeten Nostoc punctiforme ATCC 29133. 

Dieser Klon pNP196 wurde daherfurdie Klonierung in den Expressionsvektor 
pJIT117(Guerineau etal. 1988, Nucl. Acids Res. 16: 11380) verwendet. 
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pJIT1 17 wurde modifiziert, indem der 35S-Terminator durch den OCS-Terminator (Oc- 
topine Synthase) des Ti-Plasmides pTi15955 von Agrobacterium tumefaciens (Daten- 
bankeintrag X00493 von Position 12,541-12,350, Gielen et al. (1984) EMBO J. 3 835- 
846) ersetzt wurde. 

Das DNA-Fragment, das die OCS-Terminatorregion beinhaltet, wurde mittels PCR un- 
ter Verwendung des Plasmides pHELLSGATE (Datenbankeintrag AJ311874, Wesley 
et al. (2001) Plant J. 27 581-590, nach Standardmethoden aus E.coli isoliert) sowie der 
Primer OCS-1 (SEQ ID No. 85) und OCS-2 (SEQ ID No. 86) hergestellt. 

Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplifikation der DNA, die die Octopin Synthase (OCS) Terminatorregion 
(SEQ ID No. 87) beinhaltet, erfolgte in einem 50 ul Reaktionsansatz, in dem enthalten 
waren: 

- 100 ng pHELLSGATE plasmid DNA 

- 0.25 mM dNTPs 

- 0.2 mM OCS-1 (SEQ ID No. 85) 

- 0.2 mM OCS-2 (SEQ ID No. 86) 

- 5 ul 10X PCR-Puffer (Stratagene) 

- 0.25 ul Pfu Polymerase (Stratagene) 

- 28.8 ul Aq. DesL 

Die PCR wurde unter folgenden Zyklusbedingungen durchgefuhrt: 

1X94°C 2 Minuten 
35X 94°C 1 Minute 

50°C 1 Minute 

72°C 1 Minute 
1X72°C 10 Minuten 

Das 210 bp Amplifikat wurde unter Verwendung von Standardmethoden in den PCR- 
Klonierungsvektor pCR 2.1 (Invitrogen) kloniert und das Plasmid pOCS erhalten. 

Sequenzierung des Klons pOCS bestatigte eine Sequenz, die mit einem Sequenzab- 
schnitt auf dem Ti-Plasmid pTi15955 von Agrobacterium tumefaciens (Datenbankein- 
trag X00493) von Position 12.541 bis 12.350 ubereinstimmt. 



SunGene GmbH & Co. KGaA 



20040135 



PF 55341 



59 

Die Klonierung erfolgte durch Isolierung des 210 bp Sall-Xhol Fragmentes aus pOCS 
und Ligierung in den Sall-Xhol geschnittenen Vektor pJIT117. 
Dieser Klon heisst pJO und wurde daher fur die Klonierung in den Expressionsvektor 
pJONP196 verwendet. 

5 

Die Klonierung erfolgte durch Isolierung des 782 Bp Sphl-Fragmentes aus pNP196 und 
Ligierung in den Sphl geschnittenen Vektor pJO. Der Klon, derdie NP196-Ketolase 
von Nostoc punctiforme in der korrekten Orientierung als N-terminale translationale 
Fusion mit dem rbcS Transitpeptid enthalt, heisst pJONP196. 

10 

Beispiel 3: 

Herstellung von Expressionsvektoren zur blutenspezifischen Expression der NP196- 
Ketolase aus Nostoc punctiforme ATCC 29133 in Tagetes erecta 

•1 5 Die Expression der NP1 96-Ketolase aus Nostoc punctiforme in Tagetes erecta erfolgte 
f mit dem Transitpeptid rbcS aus Erbse (Anderson et al. 1986, Biochem J. 240:709-715). 
Die Expression erfolgte unter Kontrolle des blutenspezifischen Promoters EPSPS aus 
Petunia hybrida (Datenbankeintrag M37029: Nukleotidregion 7-1787; Benfeyetal. 
(1990) Plant Cell 2: 849-856). 

20 

Das DNA Fragment, das die EPSPS Promoterregion (SEQ ID No. 88) aus Petunia 
hybrida beinhaltet, wurde mittels PCR unter Verwendung genomischer DNA (nach 
Standardmethoden aus Petunia hybrida isoliert) sowie der Primer EPSPS- 1 (SEQ ID 
No. 89) und EPSPS-2 (SEQ ID No. 90) hergestellt. 

25 

Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplifikation der DNA, die das EPSPS-Promoterfragment (Datenbankein- 

• | trag M37029: Nukleotidregion 7-1787) beinhaltet, erfolgte in einem 50 ul Reaktionsan- 
30 satz, in dem enthalten war: 

- 100 ng genomischer DNA aus Athaliana 

- 0.25 mM dNTPs 

- 0.2 mM EPSPS-1 (SEQ ID No. 89) 
35 - 0.2 mM EPSPS-2 (SEQ ID No. 90) 

- 5 ul 10X PCR-Puffer (Stratagene) 

- 0.25 ul Pfu Polymerase (Stratagene) 

- 28.8 ul Aq. Dest. 
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Die PCR wurde unter folgenden Zyklusbedingungen durchgefuhrt: 



1X94°C 2 Minuten 
35X94°C 1 Minute 
50°C 1 Minute 
72°C 2 Minute 
1X72°C 10 Minuten 



Das 1773 Bp Amplifikat wurde unter Verwendung von Standardmethoden in den PCR- 
Klomerungsvektor pCR 2.1 (Invitrogen) kloniert und das Plasmid pEPSPS erhalten. 

Sequenzierung des Klons pEPSPS bestatigte eine Sequenz, die sich lediglich durch 
zwe. Delet.on (Basen ctaagtttcagga in Position 46-58 der Sequenz M37029- Basen 
aaaaatat in Position 1422-1429 der Sequenz M37029) und die Basenaustausche (T 
statt G in Position 1447 der Sequenz M37029; A statt C in Position 1525 der Sequenz 
M37029; A statt G in Position 1627 der Sequenz M37029) von der publizierten EPSPS- 
Sequenz(Datenbankeintrag M37029: Nukleotidregion 7-1787) unterscheidet. Diezwei 
Deletionen and die zwei Basenaustausche an den Positionen 1447 und 1627 der Se- 
quenz M37029 wurden in einem unabhangigen Amplifikationsexperiment reproduziert 
und reprasentieren somit die tatsachliche Nukleotidsequenz in den verwendeten Petu- 
nia hybrida Pfianzen. 

Der Klon pEPSPS wurde daher fur die Klonierung in den Expressionsvektor pJONP196 
verwendet. 



D.e Klonierung erfolgte durch Isolierung des 1763 Bp Sacl-Hindlll Fragmentes aus 
pEPSPS und Ligierung in den Sacl-Hindlll geschnittenen Vektor pJ0NP196 Der Klon 
der den Promoter EPSPS anstelle des urspriinglichen Promoters d35S enthalt. heisst' 
pJOESP:NP196. Diese Expressionskassette enthalt das Fragment NP196 in der kor- 
rekten Orientierung als N-terminale Fusion mit dem rbcS-Transitpeptid. 

Zur Herstellung des Expressionsvektors MSP107 wurde das 2.961 KB bp Sacl-Xhol 
Fragment aus pJOESP:NP196 mit dem Sacl-Xhol geschnittenen Vektor pSUN3 ligiert 
MSP 107 beinhaltet Fragment EPSPS den EPSPS Promoter (1761 bp), Fragment rbcS 
TP FRAGMENT das rbcS Transitpeptid aus Erbse (194 bp), Fragment NP196 KETO 
CDS (761 bp), kodierend fur die Nostoc punctiforme NP196-Ketolase, Fragment OCS 
Terminator (192 bp) das Polyadenylierungssignal von Octopin-Synthase. 
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Die Herstellung einer Expressionsvektors fQr die Agrobacterium-vermittelte Transfor- 
mation der EPSPS-kontrollierten NP196-Ketolase aus Nostoc punctiforme in Tagetes 
erecta erfolgte unter der Verwendung des binaren Vektors pSUN5 (WO02/00900). 

Zur Herstellung des Expressionsvektors MSP108 wurde das 2.961 KB bp Sacl-Xhol 
Fragment aus pJOESP:NP196 mit dem Sacl-Xhol geschnittenen Vektor pSUN5 ligiert. 
MSP 108 beinhaltet Fragment EPSPS den EPSPS Promoter (1761 bp), Fragment rocS 
TP FRAGMENT das rbcS Transitpeptid aus Erbse (194 bp), Fragment NP196 KETO 
CDS (761 bp), kodierend fur die Nostoc punctiforme NP196-Ketolase , Fragment OCS 
Terminator (192 bp) das Polyadenylierungssignal von Octopin-Synthase. 

Beispiel 4: 

Amplifikation einer DNA, die die gesamte Primarsequenz der NP195-Ketolase aus 
Nostoc punctiforme ATCC 29133 kodiert 

Die DNA, die fur die NP195-Ketolase aus Nostoc punctiforme ATCC 29133 kodiert, 
wurde mittels PCR aus Nostoc punctiforme ATCC 29133 (Stamm der "American Type 
Culture Collection") amplifiziert. Die Preparation von genomischer DNA aus einer Sus- 
pensionskultur von Nostoc punctiforme ATCC 29133 wurde in Beispiel 19 beschrieben. 

Die Nukleinsaure, kodierend eine Ketolase aus Nostoc punctiforme ATCC 29133, wur- 
de mittels "polymerase chain reaction" (PCR) aus Nostoc punctiforme ATCC 29133 
unter Verwendung eines sense-spezifischen Primers (NP195-1, SEQ ID No. 91) und 
eines antisense-spezifischen Primers (NP195-2 SEQ ID No. 92) amplifiziert. 

Die PCR-Bedingungen waren die folgenden: 

Die PCR zur Amplifikation der DNA, die fur ein Ketolase Protein bestehend aus der 
gesamten Primarsequenz kodiert, erfolgte in einem 50 ul Reaktionsansatz, in dem ent- 
halten war: 



- 1 ul einer Nostoc punctiforme ATCC 29133 DNA (hergestellt wie oben beschrieben) 

- 0.25 mM dNTPs 

- 0.2 mM NP195-1 (SEQ ID No. 91) 

- 0.2 mM NP195-2 (SEQ ID No. 92) 

- 5 ul 10X PCR-Puffer (TAKARA) 

- 0.25 ul R Taq Polymerase (TAKARA) 

- 25.8 ul Aq. Dest. 
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Die PCR wurde unter folgenden Zyklusbedingungen durchgefuhrt: 

1X94°C 2 Minuten 
35X94°C 1 Minute 
5 55°C 1 Minuten 
72°C 3 Minuten 
1X72°C 10 Minuten 

Die PCR-Amplifikation mit SEQ ID No. 91 und SEQ ID No. 92 resultierte in einem 819 
10 Bp-Fragment, das fur ein Protein bestehend aus der gesamten Primaxsequenz kodiert 
(NP195, SEQ ID No. 93). Unter Verwendung von Standardmethoden wurde das Ampli- 
fikat in den PCR-Klonierungsvektor pCR 2.1 (Invitrogen) kloniert und der Klon pNP195 
erhalten. 

Sequenzierung des Klons pNP195 mitdem M13F- und dem M13R-Primer bestatigte 
eine Sequenz, welche mit der DNA-Sequenz von 55,604-56,392 des Datenbank- 
eintrages NZ_AABC01 0001 965 identisch ist, mit der Ausnahme, daBT in Position 
55.604 durch A ersetzt wurde, urn ein Standard-Startkodon ATG zu erzeugen. Diese 
Nukleotidsequenz wurde in einem unabhangigem Amplifikationsexperiment reprodu- 
20 ziert und reprasentiert somit die Nukleotidsequenz im verwendeten Nostoc punctiforme 
ATCC 29133. 

Dieser Klon pNP195 wurde daher fur die Klonierung in den Expressionsvektor pJO (in 
Beispiel 6 beschrieben) verwendet. Die Klonierung erfolgte durch Isolierung des 809 
25 Bp Sphl-Fragmentes aus pNP195 und Ligierung in den Sphl geschnittenen Vektor 

pJO. Der Klon, der die NP195-Ketolase von Nostoc punctiforme in der korrekten Orien- 
tierung als N-terminale translationale Fusion mit dem rbcS Transitpeptid enthalt, heisst 
pJONP195. 

w 30 Beispiel 5: 

Amplifikation einer DNA, die die gesamte Primarsequenz der NODK-Ketolase aus No- 
dularia spumignea NSOR10 kodiert. 

Die DNA, die fOr die Ketolase aus Nodularia spumignea NSOR10 kodiert, wurde mittels 
35 PCR aus Nodularia spumignea NSOR10 amplifiziert. 

FOr die Preparation von genomischer DNA aus einer Suspensionskultur von Nodularia 
spumignea NSOR10 , die 1 Woche mit Dauerlicht und konstantem Schutteln (150 rpm) 
at 25°C in BG f f-Medium (1.5 g/l NaN0 3 , 0.04 g/l K 2 P04X3H 2 0, 0.075 g/l MgS04xH 2 0, 
40 0.036 g/l CaCI 2 x2H 2 0, 0.006 g/l citric acid, 0.006 g/l Ferric ammonium citrate, 0.001 g/l 
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EDTA disodium magnesium, 0.04 g/l Na 2 C0 3 , 1ml Trace Metal Mix "A5+Co" (2.86 g/l 
H 3 B0 3 , 1.81 g/l MnCI 2 x4H 2 o, 0.222 g/l ZnSO4x7H 2 0, 0.39 g/l NaMo04X2H 2 o, 0.079 g/l 
CuS04x5H 2 0, 0.0494 g/l Co(N0 3 ) 2 x6H 2 0) gewachsen war, wurden die Zellen durch 
Zentrifugation geemtet, in flussigem Stickstoff eingefroren und im Morser pulverisiert. 

5 

Protokoll fOr die DNA-lsolation aus Nodularis spumignea NSOR10 : 

Aus einer 10 ml FIQssigkultur wurden die Bakterienzellen durch 10 minutige Zentrifuga- 
tion bei 8000 rpm pelletiert. AnschlieBend wurden die Bakterienzellen in flussigem 
10 Stickstoff mit einem Morser zerstofien und gemahlen. Das Zellmaterial wurde in 1 ml 
10mM Tris_HCI (pH 7.5) resuspendiert und in ein Eppendorf-Reaktionsgefali (2ml Vo- 
lumen) Gberfuhrt. Nach Zugabe von 

100 pi Proteinase K (Konzentration: 20 mg/ml) wurde die Zellsuspension fur 3 Stunden 
bei 37°C inkubiert. Anschlieliend wurde die Suspension mit 500 pi Phenol extrahiert. 

•15 Nach 5minutiger Zentrifugation bei 13 000 upm wurde die obere, wassrige Phase in ein 
I neues 2 ml-Eppendorf-Reaktionsgefafi QberfOhrt. Die Extraktion mit Phenol wurde 
3mal wiederholt. Die DNA wurde durch Zugabe von 1/10 Volumen 3 M Natriumacetat 
(pH 5.2) und 0.6 Volumen Isopropanol gefallt und anschlieRend mit 70% Ethanol ge- 
waschen. Das DNA-Pellet wurde bei Raumtemperatur getrocknet, in 25 pi Wasser auf- 
20 genommen und unter Erhitzung auf 65°C gelost. 

Die Nukleinsaure, kodierend eine Ketolase aus Nodularia spumignea NSOR10, wurde 
mittels "polymerase chain reaction" (PCR) aus Nodularia spumignea NSOR10 unter 
Verwendung eines sense-spezifischen Primers (NODK-1, SEQ ID No. 94) und eines 
25 antisense-spezifischen Primers (NODK-2 SEQ ID No. 95) amplifiziert. 

Die PCR-Bedingungen waren die folgenden: 




Die PCR zur Amplifikation der DNA, die fur ein Ketolase Protein bestehend aus der 
\0 gesamten Primarsequenz kodiert, erfolgte in einem 50 ul Reaktionsansatz, in dem ent- 



halten wan 

- 1 ul einer Nodularia spumignea NSOR10 DNA (hergestellt wie oben beschrieben) 

- 0.25 mM dNTPs 

35 - 0.2 mM NODK-1 (SEQ ID No. 94) 

- 0.2 mM NODK-2 (SEQ ID No. 95) 

- 5 ul 10X PCR-Puffer (TAKARA) 

- 0.25 ul RTaq Polymerase (TAKARA) 

- 25.8 ul Aq. Dest. 

40 
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Die PCR wurde unter folgenden Zyklusbedingungen durchgefiihrt: 

1X94°C 2 Minuten 
35X94°C 1 Minute 

55°C 1 Minuten 

72°C 3 Minuten 
1X72°C 10 Minuten 

Die PCR-Amplifikation mit SEQ ID No. 94 und SEQ ID No. 95 resultierte in einem 720 
Bp-Fragment, das fur ein Protein bestehend aus der gesamten Primarsequenz kodiert 
(NODK, SEQ ID No. 96). Unter Verwendung von Standardmethoden wurde das Ampli- 
fikat in den PCR-Klonierungsvektor pCR 2.1 (Invitrogen) kloniert und der Klon pNODK 
erhalten. 

Sequenzierung des Klons pNODK mit dem M13F- und dem M13R-Primer bestatigte 
eine Sequenz, welche mit der DNA-Sequenz von 2130-2819 des Datenbank-eintrages 
AY210783 identisch ist (inverse orientiert zum veroffentlichen Datenbankeintrag). Die- 
se Nukleotidsequenz wurde in einem unabhangigem Amplifikationsexperiment repro- 
duziert und reprasentiert somit die Nukleotidsequenz im verwendeten Nodularis spu- 
mignea NSOR10. 

Dieser Klon pNODK wurde daher fur die Klonierung in den Expressionsvektor pJO (in 
Beispiel 6 beschrieben) verwendet. Die Klonierung erfolgte durch Isolierung des 710 
Bp Sphl-Fragmentes aus pNODK und Ligierung in den Sphl geschnittenen Vektor pJO. 
Der Klon, der die NODK-Ketolase von Nodularia spumignea in der korrekten Orientie- 
rung als N-terminale translationale Fusion mit dem rbcS Transitpeptid enthalt, heisst 
pJONODK 



Beispiel 6: 

Herstellung von Expressionsvektoren zur blOtenspezifischen Expression der NODK- 
Ketolase aus Nodularia spumignea NSOR10 in Lycopersicon esculentum und Tagetes 
erecta. 

Die Expression der NODK-Ketolase aus Nodularia spumignea NSOR10 in L. esculen- 
tum und Tagetes erecta erfolgte mit dem Transitpeptid rbcS aus Erbse (Anderson et al. 
1986, Biochem J. 240:709-715). Die Expression erfolgte unter Kontrolle des blOtenspe- 
zifischen Promoters EPSPS aus Petunia hybrida (Datenbankeintrag M37029: Nukleo- 
tidregion 7-1787; Benfey et al. (1990) Plant Cell 2: 849-856). 
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Der Klon pEPSPS (in Beispiel 8 beschrieben) wurde daherfur die Klonierung in den 
Expressionsvektor pJONODK (in Beispiel 12 beschrieben) verwendet. 

Die Klonierung erfolgte durch Isolierung des 1763 Bp Sacl-Hindlll Fragmentes aus 
pEPSPS und Ugierung in den Sacl-Hindlll geschnittenen Vektor pJONODK Der Klon 

!!oSpTnn?n EPSPS anSt6 " e *" Urs P rUn 9 ,ichen ^meters <*5S enthalt, heisst' 
pJOESRNODK. D.ese Expressionskassette enthalt das Fragment NODK in der korrek- 
ten Onentierung als N-terminale Fusion mit dem rbcS-Transitpeptid. 

Die Herstellung eines Expressionsvektors fur die Agrobacterium-vermittelte Transfer- 
mat.on der EPSPS-kontrollierten NODK-Ketolase aus Nodularis spumignea NSOR10 
in L. esculentum erfolgte unter der Verwendung des binaren Vektors pSUN3 
(WO02/00900). 

Zur Herstellung des Expressionsvektors MSP1 15 wurde das 2.889 KB bp Sacl-Xhol 
Fragment aus P JOESP:NODK mit dem Sacl-Xhol geschnittenen Vektor P SUN3 ligiert 

tZ^mLTT F ? 9ment EPSPS EPSPS Pr ° moter < 1761 b P)' Fra 9 me * rboS 

° S Transit P e P tid aus Er <>se (194 bp), Fragment NODKKETO 
CDS (690 bp), kodierend fur die Nodularia spumignea NSOR10 NODK-Ketolase 
Fragment OCS Terminator (1 92 bp) das Polyadenylierungssignal von Octopin- ' 
Synthase. 

Die Herstellung einer Expressionsvektors fur die Agrobacterium-vermittelte Transfor- 
mat.on der EPSPS-kontrollierten NODK-Ketolase aus Nodularia spumignea NSOR10 
in Tagetes erecta erfolgte unter der Verwendung des binaren Vektors pSUNS 
(WO02/00900). 

Zur Herstellung des Expressionsvektors MSP116 wurde das 2.889 KB bp Sacl-Xhol 
Fragment aus pJOESP:NODK mit dem Sacl-Xhol geschnittenen Vektor pSUNS ligiert 

rZ^TTf F ? 9ment EPSPS ^ EPSPS Pr ° m0ter < 1761 b P>- Fra 9 men * *cS 
I ™ ^ Translt P e P« d aus Erbse (194 bp), Fragment NODKKETO 

CDS (690 bp), kodierend Air die Nodularia spumignea NSOR10 NODK-Ketolase 
Fragment OCS rerm/nator(192 bp) das Polyadenylierungssignal von Octopin- ' 
Synthase. 

Beispiel 7; 

Herstellung transgener Tagetes Pflanzen 

Tagetessamen werden steriiisiert und auf Keimungsmedium (MS-Medium; Murashige 
and Skoog, Physiol. Plant. 15(1962), 473-497) P H 5,8, 2% Saccharose) aufgelegt. Die 
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Keimung erfolgt in einem Temperatur/Licht/Zeitintervall von 1 8-28°C/20-200 nE/3 - 16 
Wochen, bevorzugt jedoch bei 2 1 °C, 20-70 pB, fur 4-8 Wochen. 

Alle Blatter der sich bis dahin entwickelten in vitro Pflanzen werden geerntet und quer 
zur Mrttelnppe geschnitten. Die dadurch entstehenden Blattexplantate mit einer Grolie 
von 10 - 60 mm werden im Verlaufe der Preparation in fliissigem MS - Medium bei 
Raumtemperatur fQr maximal 2 h aufbewahrt. 

Ein beliebiger Agrobakterium tumefaciens Stamm, bevorzugt aber ein supervirulenter 
Stamm w.e z.B. EHA105 mit einem entsprechenden Binarplasmid, das ein Selekti- 
onsmarkergen (bevorzugt bar oder par) sowie ein oder mehrere Trait- oder Reporter- 
gene tragen kann wird (pS5FNR:NOST,pS5AP3:NOST pS5FNRNP196 
P S5EPS:NP196, pS5FNR:NP195, pS5EPS:NP195, pS5FNR:NODK und 
P S5EPS:NODK), uber Nacht angezogen und fur die Co-Kultivierung mit dem Blattma- 
tenal verwendet. Die Anzucht des Bakterienstammes kann wie folgt erfolgen: Eine Ein- 
zelkolon.e des entsprechenden Stammes wird in YEB (0,1 % Hefeextrakt, 0,5 % Rind- 
fle.schextrakt, 0,5 % Pepton, 0,5 % Saccharose, 0,5 % Magnesiumsulfat x 7 H 2 0) mit 
25 mo/I Kanamycin angeimpft und bei 28°C fur 16 bis 20 h angezogen. Anschlieftend 
w,rd die Bakteriensuspension durch Zentrifugation bei 6000 g fQr 10 min geerntet und 
derart ,n fIGssigem MS Medium resuspendiert, daft eine OD 600 von ca. 0,1 bis 0,8 ent- 
stand.D.ese Suspension wird fuer die C-Kultivierung mit dem Blattmaterial verwendet. 

Unmittelbar vor der Co-Kultivierung wird das MS-Medium, in dem die Biatter aufbe- 
wahrt worden sind, durch die Bakteriensuspension ersetzt. Die Inkubation der Blatt- 
chen in der Agrobakteriensuspension erfolgte fur 30 min unter leichtem Schutteln bei 
n «T o,Tf Ur AnSChKeBend werden in^erten Explantate auf ein mit Agar (z.B. 
0,8 /o Plant Agar (Duchefa, NL) verfestigtes MS-Medium mit Wachstumsfegulatoren 
w.e be.spielsweise 3 mg/l Benzylaminopurin (BAP) sowie 1 mg/l Indolylessigsaure ' 
(IAA) aufgelegt. Die Orientierung der Blatter auf dem Medium ist bedeutungslos Die 
Kultmerung der Explantate findet fQr 1 bis 8 Tage, bevorzugt aber fur 6 Tage statt da- 
bei konnen folgende Bedingungen angewendet werden: Lichtintensitat 30-80 
nMol/m x sec, Temperatur: 22 - 24°C, hell/dunkel Wechsel von 16/8 Stunden An- 
schLeliend werden die co-kultivierten Explantate auf frisches MS-Medium, bevorzugt 
m.t den gleichen Wachstumsregulatoren Obertragen, wobei dieses zweite Medium zu- 
satzhch ein Antibiotikum zur UnterdrOckung des Bakterienwachstums enthalt. Timentin 
in e«ner Konzentration von 200 bis 500 mg/l ist fur diesen Zweck sehr geeignet Als 
zwe.te selektive Komponente wird eine fur die Selektion des Transformationserfolges 
emgesetzt. Phosphinothricin in einer Konzentration von 1 bis 5 mg/l selektiert sehr effi- 
z.ent, aber auch andere selektive Komponenten gemaft des zu verwendenden Verfah- 
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rens sind denkbar. 

Nach jeweils ein bis drei Wochen erfolgt der Transfer der Explantate auf frisches Medi- 
um bis sich Sproftknospen und kleine Sprosse entwickeln, die dann auf das gleiche 
Basalmedium einschliefJIich Timentin und PPT oder alternative Komponenten mit 
Wachstumsregulatoren, namlich z.B. 0,5 mg/l Indolylbuttersaure (IBA) und 0,5 mg/l 
Gibberillinsaure GA 3 , zur Bewurzelung ubertragen werden. Bewurzelte Sprosse kon- 
nen ins Gewachshaus Qberfuhrt werden. 

Zusatzlich zu der beschriebenen Methode sind folgende vorteilhafte Modifikationen 
moglich: 

Bevor die Explantate mit den Bakterien infiziert werden, konnen sie fur 1 bis 12 Tage, 
bevorzugt 3 - 4, auf das oben beschriebene Medium fur die Co-Kultur vorinkubiert 
werden. AnschlieBend erfolgt die Infektion, Co-Kultur und selektive Regeneration wie 
oben beschrieben. 

Der pH Wert fur die Regeneration (normalerweise 5,8) kann auf pH 5,2 gesenkt wer- 
den. Dadurch wird die Kontrolle des Agrobakterienwachstums verbessert. 

Die Zugabe von AgN0 3 (3-10 mg/l) zum Regenerationsmedium verbessert den Zu- 
stand der Kultur einschlieBlich der Regeneration selbst. 

Komponenten, die die Phenolbildung reduzieren und dem Fachmann bekannt sind, wie 
z.B. Zitronensaure, AscorbinsSure, PVP u.v.a.m., wirken sich positiv auf die Kultur aus. 

Fur das gesamte Verfahren kann auch flussiges Kulturmedium Verwendung finden. Die 
Kultur kann auch auf handelsOblichen Tragern, die auf dem flQssigen Medium positio- 
niert werden inkubiert werden. 

GemSli der oben beschriebenen Transformationsmethode wurden mit folgenden Ex- 
pressionskonstrukten folgende Linien erhalten: 

Mit pS5FNR:NOST wurde beispielsweise erhalten: MSP102-1, MSP102-2, MSP102-3, 
Mit pS5AP3:NOST wurde beispielsweise erhalten: MSP104-1, MSP104-2, MSP104-3 
Mit pS5FNR:NP196 wurde erhalten: MSP106-1, MSP106-2, MSP106-3 



MitpS5EPS:NP196 wurde erhalten: MSP108-1, MSP108-2, MSP108-3 
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MitpS5FNR:NP195 wurde erhalten: MSP110-1, MSP110-2, MSP110-3 
MitpS5EPS:NP195 wurde erhalten: MSP1 12-1, MSP1 12-2 MSP112-3 

5 

Mit pS5FNR:NODK wurde erhalten: MSP114-1, MSP114-2, MSP114-3 
Mit pS5EPS:NODK wurde erhalten: MSP116-1, MSP116-2, MSP116-3 
10 Beispiel 8: 

Enzymatische Lipase-katalysierte Hydrolyse von Carotinoidestern aus Pflanzenmateri- 
al und Identifizierung der Carotinoide 



hi 5 



20 



25 



40 



Allgemeine Arbeitsvorschrift 

a) Gembrsertes Pflanzenmaterial (z.B. Petalenmaterial) (30-100 mg Frischgewicht) 
wird mit 100% Aceton (dreimal 500ul; jeweils etwa 15 Minuten schQtteln) extrahiert. 
Das Losungsmittel wird evaporiert. Carotinoide werden anschlieliend in 495 ul Aceton 
aufgenommen, 4,95 ml Kaliumphosphatpuffer (100 mM, pH7.4) zugegeben und gut 
gemischt. Danach erfolgt die Zugabe von ca. 17 mg Bile-Salze (Sigma) und 149 pi el- 
ner NaCI/CaCI 2 -L6sung (3M NaCI und 75 mM CaCI 2 ). Die Suspension wird fur 30 Mi- 
nuten bei 37°C inkubiert. Fur die enzymatische Hydrolyse der Carotinoidester wird 595 
pi einer LipaselSsung (50 mg/ml Lipase Typ7 von Candida rugosa (Sigma)) zugegeben 
und unter SchQtteln bei 37C inkubiert. Nach etwa 21 Stunden erfolgte nochmals eine 
Zugabe von 595 pi Lipase mit erneuter Inkubation von mindestens 5 Stunden bei 37°C. 
Anschlieliend werden etwa ca. 700 mg Na 2 S0 4 in der Losung gelost. Nach Zugabe 
von 1800 pi Petrolether werden die Carotinoide durch kraftig Mischen in die organische 
Phase extrahiert. Dieses AusschOtteln wird solange wiederholt, bis die organische 
Phase farblos bleibt. Die Petroletherfraktionen werden vereinigt und der Petrolether 
evaporiert. Freie Carotinoide werden in 100-120 pi Aceton aufgenommen. Mittels 
HPLC und C30-reverse phase-Saule konnen freie Carotinoide aufgrund von Retenti- 
onszeit und UV-VIS-Spektren identifiziert werden. 



Die verwendeten Bile-Salze oder Gallensauresalze sind 1:1 Mischungen von Cholat 
35 und Desoxycholat. 

b) Arbeitsvorschrift fOrAufarbeitung, wenn nur geringe Mengen an Carotinoidestern im 
Pflanzenmaterial vorhanden sind 



Altemativ kann die Hydrolyse der Carotinoidester durch Lipase aus Candida rugosa 
nach Trennung mittels DOnnschichtchromatographie erreicht werden. Dazu werxJen 50- 
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100mg Pflanzenmaterial dreimal mit etwa 750|jJ Aceton extrahiert Der Losungsmit- 
telextrakt wird im Vakuum einrotiert (erhohte Temperaturen von 40-50°C sind tolera- 
bel). Danach erfolgt Zugabe von 300pJ PetrolethenAceton (Verhaltnis 5:1) und gute 
Durchmischung. Schwebstoffe werden durch Zentrifugation (1-2 Minuten) sedimentiert. 
5 Die obere Phase wird in ein neues ReaktionsgefSft uberfuhrt. Das verbleibende Rest 
wird erneut mit 200pJ Petrolether: Aceton (Verhaltnis 5:1) extrahiert und Schwebstoffe 
werden durch Zentrifugation entfernt. Die beiden Extrakte werden zusammengefuhrt 
(Volumen 500|xl) und die Losungsmittel evaporiert. Der Ruckstand wird in 30jjJ Petrol- 
ether: Aceton (Verhaltnis 5:1) resuspendiert und auf eine DQnnschichtplatte (Silica-Gel 
10 60, Merck) aufgetragen. Falls mehr als eine Auftragung fur praparativ-analytische Zwe- 
cke erforderlich ist, sollten mehrere Aliquots mit jeweils 50-100 mg Frischgewicht in der 
beschriebenen Weise ftir die dQnnschichtchromatographische Trennung aufbereitet 
werden. 

|5 Die DQnnschichtplatte wird in PetrolethenAceton (Verhaltnis 5:1) entwickelt. Caroti- 
" noidbanden konnen visuell aufgrund ihrer Farbe identifiziert werden. Einzelne Caroti- 
noidbanden werden ausgekratzt und konnen fur praparativ-analytische Zwecke gepoolt 
werden. Mit Aceton werden die Carotinoide vom Silica-Material eluiert; das Losungs- 
mittel wird im Vakuum evaporiert. Zur Hydrolyse der Carotinoidester wird der Ruck- 
20 stand in 495pl Aceton gelost, 17mg Bile-Salze (Sigma), 4,95ml 0.1M Kaliumphosphat- 
puffer (pH 7,4) und 149*il (3M NaCI, 75mM CaCI 2 ) zugegeben. Nach guter Durchmi- 
schung wird 30min bei 37°C aquilibriert. Danach erfolgt die Zugabe von 595jllI Lipase 
von Candida rugosa (Sigma, Stammlosung von 50mg/ml in 5mM CaCI 2 ). Ober Nacht 
erfolgt die Inkubation mit Lipase unter Schutteln bei 37°C. Nach etwa 21 Stunden wird 
25 nochmals die gleiche Menge an Lipase zugegeben; fur mindestens 5 Stunden wird 
nochmals bei 37°C unter Schutteln inkubiert. Dann erfolgt die Zugabe von 700mg 
Na 2 S0 4 (wasserfrei); mit 1800jxl Petrolether wird fur ca. 1 Minute ausgeschuttelt und 
„ die Mischung bei 3500 Umdrehungen/Minute fur 5 Minuten zentrifugiert. Die obere 
f Phase wird in ein neues ReaktionsgefaB Qberfuhrt und das Ausschutteln so lange wie- 
30 derholt, bis die obere Phase farblos ist. Die vereinigte Petrolether-Phase wird im Vaku- 
um eingeengt (Temperaturen von 40-50°C sind moglich). Der Ruckstand wird in 120jil 
Aceton, eventuell mittels Ultraschall, gelost. Die gelosten Carotinoide konnen mittels 
HPLC unter Verwendung einer C30-Saule getrennt und anhand von Referenzsubstan- 
zen quantifiziert werden. 

35 

Beispiel 9: 

HPLC-Analyse freier Carotinoide 

Die Analyse der nach der Arbeitsvorschriften in Beispiel 15 erhaltenen Proben erfolgt 
40 unter folgenden Bedingungen: 
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Folgende HPLC-Bedingungen wurden eingesteilt. 

Trennsaule: Prontosil C30-Saule, 250 x 4,6 mm, (Bischoff, Leonberg, Germany) 

Flussrate: 1.0 ml/min 

Eluenten: Laufmittel A - 1 00% Methanol 

Laufmittel B - 80% Methanol, 0.2% Ammoniumacetat 

Laufmittel C - 100% t-Butyl-methylether 
Detektion: 300-530 nm 



Gradientenprofil: 



Zeit 


Flussrate 


% Laufmittel A 


% Laufmittel B 


% Laufmittel C 


1.00 


1.0 


95.0 


5.0 


0 


12.00 


1.0 


95.0 


5.0 


0 


12.10 


1.0 


80.0 


5.0 


15.0 


22.00 


1.0 


76.0 


5.0 


19.0 


22.10 


1.0 


66.5 


5.0 


28.5 


38.00 


1.0 


15.0 


5.0 


80.0 


45.00 


1.0 


95.0 


5.0 


0 


46.0 


1.0 


95.0 


5.0 


0 



Einige typische Retentionszeiten fur erfindungsgemafi gebildete Carotinoide sind z.B 
Violaxanthin 11,7 min, Astaxanthin 17,7 min, Adonixanthin 19 min, Adonirubin 19,9 
min, Zeaxanthin 21 min. 
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Patentanspruche 



1 . Verwendung eines Promotors, ausgewahlt aus der Gruppe 

A) EPSPS Promoter 

B) B-Gene Promotor 

C) PDS Promotor und 

D) CHRC Promotor 



zur Expression von Genen in Pflanzen der Gattung Tagetes, mit der Mafcgabe, dass 
Gene aus Pflanzen der Gattung Tagetes, die in Wildtyppflanzen der Gattung Tagetes 
von dem jeweiligen Promotor exprimiert werden, ausgenommen sind. 

2. Verwendung nach Anspruch 1 , dadurch gekennzeichnet, dass die Expression spe- 
zifisch in Bluten erfolgt. 

3. Verwendung nach Anspruch 2, dadurch gekennzeichnet, dass die Expression spe- 
zifisch in Petalen erfolgt. 

4. Verwendung nach einem der Anspriiche 1 bis 3, dadurch gekennzeichnet, dass 
der EPSPS Promotor gemali Anspruch 1 

A1) die Nukleinsauresequenz SEQ. ID. NO. 1, 2 Oder 3 Oder 
A2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 
auf Nukleinsaureebene mit der jeweiligen Sequenz SEQ. ID. NO. 1, 2 oder 
3 aufweist oder 

A3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

1 , 2 oder 3 unter stringenten Bedingungen hybridisiert oder 
A4) funktionell aquivalente Fragmente der Sequenzen unter A1), A2) oder A3) 

enthalt. 

5. Verwendung nach einem der AnsprQche 1 bis 3, dadurch gekennzeichnet, dass 
der B-Gene Promotor gemali Anspruch 1 



B1) die Nukleinsauresequenz SEQ. ID. NO. 4, 5 oder 6 oder 
135/2004 Mec... 22:07.2004 
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B2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 
auf Nukleinsaureebene mit der jeweiligen Sequenz SEQ. ID. NO. 4, 5 oder 
6 aufweist oder 

B3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

4, 5 oder 6 unter stringenten Bedingungen hybridisiert oder 
B4) funktionell aquivalente Fragmente der Sequenzen unter B1), B2) oder B3) 

enthalt. 

Verwendung nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, dass 
der PDS Promotor gemafj Anspruch 1 

C1) die Nukleinsauresequenz SEQ. ID. NO. 7, 8, 9 oder 10 oder 
C2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 
auf Nukleinsaureebene mit der jeweiligen Sequenz SEQ. ID. NO. 7, 8, 9 
oder 10 aufweist oder 
C3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

7, 8, 9 oder 10 unter stringenten Bedingungen hybridisiert oder 
C4) funktionell aquivalente Fragmente der Sequenzen unter C1), C2) oder C3) 

enthalt. 

25 7. Verwendung nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, dass 
der CHRC Promotor gemafi Anspruch 1 

D1) die Nukleinsauresequenz SEQ. ID. NO. 1 1, 12, 13 oder 14 oder 
D2) eine von diesen Sequenzen durch Substitution, Insertion oder Deletion von 
Nukleotiden abgeleitete Sequenz, die eine Identitat von mindestens 60 % 
auf Nukleinsaureebene mit der jeweiligen Sequenz SEQ. ID. NO. 11,12, 
13 oder 14 aufweist oder 
D3) eine Nukleinsauresequenz, die mit der Nukleinsauresequenz SEQ. ID. NO. 

11, 12, 13 oder 14 unter stringenten Bedingungen hybridisiert oder 
D4) funktionell aquivalente Fragmente der Sequenzen unter D1), D2) oder D3) 

enthalt. 
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Genetisch veranderte Pflanze der Gattung Tagetes, wobei die genetische Veran- 
derung zu einer Erhohung oder Verursachung der Expressionsrate mindestens ei- 
nes Gens im Vergleich zum Wildtyp fuhrt und bedingt ist durch die Regulation der 
Expression dieses Gens in der Pflanze durch Promotoren gemafJ einem der An- 
sprOche 1 bis 7. 



9. Genetisch veranderte Pflanze nach Anspruch 8, dadurch gekennzeichnet, dass die 
Regulation der Expression von Genen in der Pflanze durch Promotoren gemali ei- 
nem der AnsprQche 1 bis 7 dadurch erreicht wird, dass man 

a) eine oder mehrere Promotoren gemafl einem der AnsprOche 1 bis 7 in das 
Genom der Pflanze einbringt, so dass die Expression eines oder mehrerer 
endogenen Gene unter der Kontrolle der eingebrachten Promotoren ge- 
maB einem der AnsprOche 1 bis 7 erfolgt oder 

b) ein oder mehrere Gene in das Genom der Pflanze einbringt, so dass die 
Expression eines oder mehrerer der eingebrachten Gene unter der Kon- 
trolle der endogenen Promotoren gemaft einem der AnsprOche 1 bis 7 er- 
folgt oder 

c) ein oder mehrere Nukleinsaurekonstrukte, enthaltend mindestens einen 
Promoter gemafi einem der Anspruche 1 bis 7 und funktionell verknQpft 
eine oder mehrere, zu exprimierende Gene, in die Pflanze einbringt. 

10. Genetisch veranderte Pflanze der Gattung Tagetes, enthaltend einen Promoter 
gemali einem der AnsprOche 1 bis 7 und funktionell verknOpft ein zu eprimierendes 
Gen, mit der Maligabe, dass Gene aus Pflanzen der Gattung Tagetes, die in Wild- 
typpflanzen der Gattung Tagetes von dem jeweiligen Promotor exprimiert werden, 
ausgenommen sind. 

11. Genetisch veranderte Pflanze nach einem der AnsprOche 8 bis 10, dadurch ge- 
kennzeichnet, dass die zu exprimierenden Gene ausgewahlt sind aus der Gruppe 
Nukleinsauren kodierend ein Protein aus den Biosyntheseweg von proteinogenen 
und nicht-proteinogenen Aminosauren, Nukleinsauren kodierend ein Protein aus 
dem Biosyntheseweg von Nukleotiden und Nukleosiden, Nukleinsauren kodierend 
ein Protein aus dem Biosyntheseweg von organischen Sauren, Nukleinsauren ko- 
dierend ein Protein aus dem Biosyntheseweg von Lipiden und Fettsauren, Nuk- 
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leinsauren kodierend ein Protein aus dem Biosyntheseweg von Diolen, Nuklein- 
sauren kodierend ein Protein aus dem Biosyntheseweg von Konhlenhydraten, 
Nukleinsauren kodierend ein Protein aus dem Biosyntheseweg von aromatischen 
Verbindung, Nukleinsauren kodierend ein Protein aus dem Biosyntheseweg von 
Vitaminen, Nukleinsauren kodierend ein Protein aus dem Biosyntheseweg von Ca- 
rotinoiden, Nukleinsauren kodierend ein Protein aus dem Biosyntheseweg von Co- 
faktoren und Nukleinsauren kodierend ein Protein aus dem Biosyntheseweg von 
Enzymen, wobei die Gene gegebenenfalls weitere Regulationselemente enthalten 
konnen. 



!. Genetisch veranderte Pflanze nach Anspruch 11, dadurch gekennzeichnet, dass 
man als zu exprimierende Gene Nukleinsauren kodierend ein Protein aus dem 
Biosyntheseweg von Carotinoiden verwendet. 

>. Genetisch veranderte Pflanze nach Anspruch 12, dadurch gekennzeichnet, dass 
die zu exprimierenden Gene ausgewahlt sind aus der Gruppe Nukleinsauren, ko- 
dierend eine Ketolase, Nukleinsauren kodierend eine p-Hydroxylase, Nukleinsau- 
ren kodierend eine p-Cyclase, Nukleinsauren kodierend eine e-Cyclase, Nuklein- 
sauren kodierend eine Epoxidase, Nukleinsauren kodierend eine HMG-CoA- 
Reduktase, Nukleinsauren kodierend eine (E)-4-Hydroxy-3-Methylbut-2-enyl- 
Diphosphat-Reduktase, Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5- 
Phosphat-Synthase, Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5-Phosphat- 
Reduktoisomerase, Nukleinsauren kodierend eine Isopentenyl-Diphosphat-A- 
Isomerase, Nukleinsauren kodierend eine Geranyl-Diphosphat-Synthase, Nuklein- 
sauren kodierend eine Famesyl-Diphosphat-Synthase, Nukleinsauren kodierend 
eine Geranyl-Geranyl-Diphosphat-Synthase, Nukleinsauren kodierend eine Phy- 
toen-Synthase, Nukleinsauren kodierend eine Phytoen-Desaturase, Nukleinsauren 
kodierend eine Prephytoen-Synthase, Nukleinsauren kodierend eine Zeta-Carotin- 
Desaturase, Nukleinsauren kodierend ein crtlSO Protein, Nukleinsauren kodierend 
ein FtsZ Protein und Nukleinsauren kodierend ein MinD Protein. 

Verfahren zur Herstellung von biosynthetischen Produkten durch Kultivierung von 
genetisch veranderten Pflanzen der Gattung Tagetes gemafc einem der AnsprQche 
8 bis 13. 
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15. Verfahren zur Herstellung von Carotinoiden durch Kultivierung von genetisch ver- 
anderten Pflanzen gemali einem der AnsprQche 8 bis 13, dadurch gekennzeichnet, 
dass die zu exprimierenden Gene ausgewahlt sind aus der Gruppe Nukleinsauren, 
kodierend eine Ketolase, Nukleinsauren kodierend eine p-Hydroxylase, Nuklein- 
sauren kodierend eine p-Cyclase, Nukleinsauren kodierend eine e-Cyclase, Nuk- 
leinsauren kodierend eine Epoxidase, Nukleinsauren kodierend eine HMG-CoA- 
Reduktase, Nukleinsauren kodierend eine (E)-4-Hydroxy-3-Methylbut-2-enyl- 
Diphosphat-Reduktase, Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5- 
Phosphat-Synthase, Nukleinsauren kodierend eine 1-Deoxy-D-Xylose-5-Phosphat- 
Reduktoisomerase, Nukleinsauren kodierend eine Isopentenyl-Diphosphat-A- 
Isomerase, Nukleinsauren kodierend eine Geranyl-Diphosphat-Synthase, Nuklein- 
sauren kodierend eine Farnesyl-Diphosphat-Synthase, Nukleinsauren kodierend 
eine Geranyl-Geranyl-Diphosphat-Synthase, Nukleinsauren kodierend eine Phy- 
toen-Synthase, Nukleinsauren kodierend eine Phytoen-Desaturase, Nukleinsauren 
kodierend eine Prephytoen-Synthase, Nukleinsauren kodierend eine Zeta-Carotin- 
Desaturase, Nukleinsauren kodierend ein crtlSO Protein, Nukleinsauren kodierend 
ein FtsZ Protein und Nukleinsauren kodierend ein MinD Protein. 

16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass man nach dem Kulti- 
vieren die genetisch veranderten Pflanzen erntet und anschlieflend die Carotinoide 
aus den genetisch veranderten Pflanzen isoliert. 

17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, dass man die BIQten der 
genetisch veranderten Pflanzen erntet und anschlieSend die Carotinoide aus den 
Petalen der genetisch veranderten Pflanzen isoliert. 

18. Verfahren nach einem der AnsprQche 15 bis 17, dadurch gekennzeichnet, dass die 
Carotinoide ausgewahlt sind aus der Gruppe Phytoen, Lycopin, Lutein, Zeaxanthin, 
Astaxanthin, Canthaxanthin, Echinenon, 3-Hydroxyechinenon, 3'- 
Hydroxyechinenon, Adonirubin, Violaxanthin und Adonixanthin. 



04sequ.txt 
SEQUENCE LISTING 



<110> SunGene GmbH & Co, KGaA 

<120> Promotoren zur Expression von Genen in Tagetes 

<130> PF 55341 

<160> 97 

<170> Patentln version 3.1 

0> 1 

<211> 174 

<212> DNA 

<213> Petunia hybrida 
<220> 

<221> promoter 

<222> CD - - (174) 

<223> EPSPS Promotor 



<400> 1 

.aacacag ctggaatttt ttacaaaggt agttggtgaa gctagtcagc gaatcccatt 





'ttccact ctacctaacc cccttcacca acaacaaatt tctgtaattt aaaaactagc 
caaaaaagaa ctctctttta caaagagcca aagactcaat ctttactttc aaga 

<210> 2 

<211> 1781 

<212> DNA 

<213> Petunia hybrida 
<220> 

<221> promoter 

<222> (1) . . C1781) 
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<223> EPSPS Promotor 
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<400> 2 

tagcgcaatc ttatgtggta caaatcttga ttagtcgggc taagtttcag gaaaaaaatg 60 

atgtggccct acaaatggtt ggaggatggg agatttggct ctatctagag ttatgtggtt 120 

gttgaagcat ttggttactc tctgctgtgg tagttggcat atccacattg tctccttcca 180 

cttttatgac aattacgtga aagttatggg ttgttttgtc tatttttgtc gaggcctttc 240 

ttttccttcc aggttgttga agatggtcca attcgattag aataatgttt tgagctttag 300 

catattctct ctcgtttaca cgattatagt aataatgata taggatgaca gaagttgaca 360 

cataaatttt ttattctctc catttacttt aatccaaatc tcacctaccc taaacttctt 420 

taatatgtat tcaatagtct atccgagtaa attgtaaatt taacaaccat tgataatatt 480 

gacacctact aacatatact agtaaagaga atattaacat ggcacatata atttgatgca 540 

tgagtat gatgaaattt aaacccaaaa tctcttgatt ttgacagtgt caccttgact 600 

Ittaactaa taagtcatgt tttagtggca gaaagacaaa ctcatccacc aactgtatag 660 

caataaaaaa tagaagaatc ttcctgaggc aaagttttgg aaaaattaag agtggctgag 720 

atttaatttc aacaggaatt agttccactt aacttttagg ttacgataca gtgctaatta 780 
aataacttaa ttgtattaga tatttcttgc acctaaaaaa tttaaaaact gaaaaaaggt 



gac 



<210> 3 
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agcaatcaaa ataaacaaaa ggacaaaata agtgaaaggt acagccacca accctggcgg 900 

ctcactgttt gttggttaaa acgtagactt acacctacca aaatctacaa ctaaaatgag 960 

gcaataatac tttgcccaaa attaccaaga aaagaaaaag aaaggaatcc cttaatatta 1020 

ctctcctcca tttcacaata aatatcctag tttgacttaa attagagttt aaaaaatgaa 1080 

agacgacttt taaaacttgt aatctaaaat aaatcatagt taaatgtgtg gctataaatc 1140 

attgtattaa cggtaaagtg gtaagtttaa aagttaattg ttttcaaata taaaattgta 1200 

•tcattct ttttggaatg gactaataag aaaactatga catccattat ggagcggagg 1260 

tatctcc ttttaacaat aacctttgtc ccttcaattc aattatcagt atgcaaacat 1320 

taaaaattat tattgatgtt aagtaccaca tcatccttaa tgatagaatc atcgtagaac 1380 

gcttttccag gcacacattc aaactagtta gaccaaaaaa tatgtaccac acatcgaata 1440 

gtccagactt ctttgtttga atagtcgact acattggata atggaacttc tcgaattaac 1500 

ttcgaattag tcgagcccca aataatatat acgtcgggtg gaaaactata aaatgtttga 1560 

caaaaatgtc aaattaatat atcaatctgc aacaaccttt tcaccttgag aacacagctg 1620 

gaatttttta caaaggtagt tggtgaagct agtcagcgaa tcccattacc ttccactcta 1680 

cctaaccccc ttcaccaaca acaaatttct gtaatttaaa aactagccaa aaaagaactc 1740 

tcttttacaa agagccaaag actcaatctt tactttcaag a 1781 



04sequ.txt 

<211> 1760 
<212> DNA 

<213> Petunia hybrida 
<220> 

<221> promoter 
<222> CD . ■ (1760) 
<223> EPSPS Promotor 

<400> 3 

tagcgcaatc ttatgtggta caaatcttga ttagtcggga aaaaatgatg tggccctaca 60 

aatggttgga ggatgggaga tttggctcta tctagagtta tgtggttgtt gaagcatttg 120 

•kactctct gctgtggtag ttggcatatc cacattgtct ccttccactt ttatgacaat 180 

cgtgaaag ttatgggttg ttttgtctat ttttgtcgag gcctttcttt tccttccagg 240 

ttgttgaaga tggtccaatt cgattagaat aatgttttga gctttagcat attctctctc 300 

gtttacacga ttatagtaat aatgatatag gatgacagaa gttgacacat aaatttttta 360 

ttctctccat ttactttaat ccaaatctca cctaccctaa acttctttaa tatgtattca 420 

atagtctatc cgagtaaatt gtaaatttaa caaccattga taatattgac acctactaac 480 

atatactagt aaagagaata ttaacatggc acatataatt tgatgcaaaa tgagtatgat 540 

gaaatttaaa cccaaaatct cttgattttg acagtgtcac cttgacttgt taactaataa 600 

gtcatgtttt agtggcagaa agacaaactc atccaccaac tgtatagcaa taaaaaatag 660 

aagaatcttc ctgaggcaaa gttttggaaa aattaagagt ggctgagatt taatttcaac 720 

aggaattagt tccacttaac ttttaggtta cgatacagtg ctaattaaat aacttaattg 780 

•tagatat ttcttgcacc taaaaaattt aaaaactgaa aaaaggtagc aatcaaaata 840 

aaaagga caaaataagt gaaaggtaca gccaccaacc ctggcggctc actgtttgtt 900 

ggttaaaacg tagacttaca cctaccaaaa tctacaacta aaatgaggca ataatacttt 960 

gcccaaaatt accaagaaaa gaaaaagaaa ggaatccctt aatattactc tcctccattt 1020 

cacaataaat atcctagttt gacttaaatt agagtttaaa aaatgaaaga cgacttttaa 1080 

aacttgtaat ctaaaataaa tcatagttaa atgtgtggct ataaatcatt gtattaacgg 1140 

taaagtggta agtttaaaag ttaattgttt tcaaatataa aattgtacta tcattctttt 1200 

tggaatggac taataagaaa actatgacat ccattatgga gcggagggag tatctccttt 1260 

taacaataac ctttgtccct tcaattcaat tatcagtatg caaacattaa aaattattat 1320 

tgatgttaag taccacatca tccttaatga tagaatcatc gtagaacgct tttccaggca 1380 

cacattcaaa ctagttagac cagtaccaca catcgaatat tccagacttc tttgtttgaa 1440 

tagtcgacta cattggataa tggaacttct cgaattaact tcgaattagt cgagcccaaa 1500 
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ataatatata cgtcgggtgg aaaactataa aatgtttgac aaaaatgtca aattaatata 1560 

tcaatctgca acaacctttt caccttgaga acacagctga aattttttac aaaggtagtt 1620 

ggtgaagcta gtcagcgaat cccattacct tccactctac ctaaccccct tcaccaacaa 1680 

caaatttctg taatttaaaa actagccaaa aaagaactct cttttacaaa gagccaaaga 1740 

ctcaatcttt actttcaaga 1760 

<210> 4 

<211> 1210 

<212> DNA 

<213> Lycopersicon esculentum 




0> 

!l> promoter 



<222> (1)..(1210) 
<223> B-Gene Promotor 

<400> 4 

gaattctctg aaaaggagca ccatatttgc cgcactgtgg ttcatatttc caagtacatt 60 

tagatgaact atatcatcag attgaaaggt tattgtataa tcaatccagt ggattctcgt 120 

tctggcacct ttagaagtac atgtgcggaa aagaatgata aggtttgtat tgttgttgac 180 

aaagcctgtt gcctttctca tttgtaaatg ttctgaacga ctcctaaatt actcttaagg 240 

tgtaaggtct tccgtgcctg tttgtaaata taatgctgtg ccgtgactta ccttttgtac 300 

catttgttca aatgtatggc ctgaacacca gggttgtcaa aaatgtctca tgcccgtttt 360 

•ggtctga aaatggcgtg atgccaaatt ctgccgctcc acagtgagca tttcgatcta 420 

gaaattg accaacttat tttatcactt gataactaaa caaaatccta ttaactttaa 480 

tcatacattg tatttatacc gaaaaattta tgcataactc attaaattac cttttttagc 540 

agtcaaattc taaatcagtt tctaatttat caaaatggct tttatagggt cccatttcca 600 

ctaatatacc tgccgtccat gcactgacta caaaacaaat acctcactat gtttgttagt 660 

gcttggtaat ataaaacctt ttcttttatg agaaagttca ccgagaataa ttttctattt 720 

gtggcataat agtatatagt gcagattgac aagaatttaa ttttgcagtt gggcacatga 780 

acaattttcc tcaaagttgt agaaagtact tttcattttc ttgtcaccga aaattattta 840 
taattgaaat taaaaccgaa tgagctgcaa gattcaagtc gaattttcaa aagaattgac - 900 

caagaaaaaa ttcaaaaata tcccccaccc cctaccaaac acatcctaaa gtgaggtata 960 

gactgggact gggattggga aaagggtaaa atgctttcac tagcttagca aagattccac 1020 

tttgttagct atctttcttt ctcatttcct tttttctttt tctttttttt gttatataag 1080 
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ccaaagtagg tacccaaaag catcaatatt ttgtattgct tggtgattcc tctgtagtcc 
agtatttcat tttctacaag ttccacctcc ctccataatt aaccattatc aatcttatac 
attctctata 

<210> 5 

<211> 1599 

<212> DNA 

<213> Lycopersicon esculentum 



1140 
1200 
1210 




<220> 

<221> promoter 

2> (I) . . C1599) 

3> B-Gene Promotor 



<400> 5 
atctcattgt 




ctgtttcata 
agtaatttac 
agtttgaagc 

aggggtttgt 

ggaggcatca 
ccgcactgtg 
gttattgtat 
agaatga 
xctgaac 
tataatgctg 
tagggttgtc 
ttggtctgag 
tggaaattga 
aataacttca 
cctttttttg 
ggtcccagtt 
tatgtttgtt 
taattttcta 
aattttgcag 



atagcttgtc 
cttctatcaa 
ctttagttcg 
cttttggtct 
tgacatgcct 
ctctaccttc 
gttcatattt 
aatcaatcca 
taaggtttgt 
gactcctaaa 
tgccgtgact 
aaaaatgtct 
aacggcgtga 
ccaacttatt 
atcatacatt 
cagtcaaaaa 
ccattaatat 
agtgcttggt 
tttgtggcat 
ttgggcacat 



ttttgtttca 
ccttgtgtga 
actacatcaa 
ggtatatttg 
gattgtgctc 
ctgcagatca 
ccaattacat 
gtggattctc 
attgttgttg 
ttactcttaa 
taccttttgt 
catgacttca 
tgccaaattc 
ttatcacttg 
gtatttatat 
ttctagatca 
acctgccgtc 
aatataaaac 
aactagtatc 
gaacaatttt 



gtcgtcttag gcttgggtta 
gttcctttat aaaatatgac 
gatttgcatc attctcgtcc 
tcaatctgag cttcgcaact 
ttcctttact tgataattgc 
tgaattctct gaaaaggagc 
ttagatgaac tatatcatca 
gttctggcac ctttagaagt 
acaaggcctg ttgcctttct 
agtgtaaggt cttccgtgcc 
accatttgtt caaatgtatg 
cccttctttc ttgtcttggt 
tgccgctcca cagtgagcat 
ataactagag tctgggttca 
tgaaaaaatt atgcacaact 
gtttctaatt aatcaaaatg 
catgcactga ttacaagaca 
cttttctttt atgagaaagt 
gaagtatata gtgcagattg 



cctcaaagtt gtagaaaata 
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gttggtgttg 
tgttggagga 
aagaaatctt 
ttctcatgac 
tgcttgttgc 
accatatttg 
ggagtgaaag 
acatgtgcgg 
catttgtaaa 
tgtttgtata 
gcctggacac 
gcccgtttta 
ttcgatctac 
aacaaaatcc 
cagtaaatta 
gcctttatag 
aatacctcac 
tcaccgaaaa 
acaagaattt 
tttttcattt 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 



<210> 6 

<211> 1204 

<212> DNA 

3> Lycopersicon esculentum 





1260 
1320 
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tcttgtcacc gaaaattatt tataattgaa attgaaaccg aatgagctgc aagactcgag 
tcgaatttca aaaaaattga ccaactaaat atgaaaaaat ccgaatatat cccccacccc 
ctaccaaaca catcctaaag tgaggtatag actgggactg ggattgggaa aagggtaaaa 1380 
tgctttcact agcttagcaa agattccact ttgttagcta tctttctttc tcatttcctt 1440 
ttttcttttt cttttttttg ttatataagc caaagtaggt acccaaaagc atcaatattt 1500 
tgtattgctt ggtgattcct ctttactcca gtatttcatt ttctacaagt tccacctccc 1560 
tccataatta accattatca atcttataca ttttctata 



1599 



<220> 

<221> promoter 
<222> (1) . . (1204) 
<223> B-Gene Promotor 

<400> 6 

tctgaaaagg agcaccatat ttgccgcact gtggttcata tttccaagta catttagatg 60 

aactatatca tcagattgaa aggttattgt ataatcaatc cagtggattc tcgttctggc 120 

acctttagaa gtacatgtgc ggaaaagaat gataaggttt gtattgttgt tgacaaagcc 180 

tgttgccttt ctcatttgta aatgttctga acgactccta aattactctt aaggtgtaag 240 

— .ttccgtg cctgtttgta aatataatgc tgtgccgtga cttacctttt gtaccatttg 300 

■aaatgta tggcctggac accagggttg tcaaaaatgt ctcatgcccg ttttattggt 360 

ctgagaatgg cgtgatgcca aattctgccg ctccacagtg agcatttcga tctactggaa 420 

attgaccaac ttattttatc acttgataac taaacaaaat cctattaact ttaatcatac 480 

attgtattta taccgaaaaa gttatgcata actcagtaaa ttaccttttt tagcagtcaa 540 

attctagatc agtttctaat ttatcaaaat ggcttttata gggtcccagt tccactaata 600 

tacctgccgt ccatgcactg actacaagac aaatacctca ctatgtttgt tagtgcttgg 660 

taatataaaa ccttttcttt tatgagaaag ttcaccgaga ataattttct atttgtggca 720 

taactagtat atagtgcaga ttgacaagaa tttaattttg cagttgggca catgaacaat 780 

tttcctcaaa gttgtagaaa gtacttttca ttttcttgtc accgaaaatt atttataatt 840 

gaaattaaaa ccgaatgagc tgcaagattc aagtcgaatt tcaaaagaat tgaccaagaa 900 

aaaattcaaa aatatccccc accccctacc aaacacatcc taaagtgagg tatagactgg 960 
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gactgggatt gggaaaaggg taaaatgctt tcactagctt agcaaagatt ccactttgtt 1020 

agctatcttt ctttctcatt tccttttttc tttttctttt ttttgttata taagccaaag 1080 

taggtaccca aaagcatcaa tattttgtat tgcttggtga ttcctctgta gtccagtatt 1140 

tcattttcta caagttccac ctccctccat aattaaccat tatcaatctt atacattctc 1200 

ta-ca 1204 

<210> 7 

<211> 2078 

<212> DNA 

<213> Lycopersicon esculentum 



•0> 

1> promoter 

<222> (1) . . (2078) 

<223> PDS Promotor 



<400> 7 

tttgccagta ttacaacagc ttatatgttg agcaggtaaa agcttcaatg ccctattctt 60 

tctacagtta tcaatgttgc tcgtctaata tctggtgttc ttctcgaaat gtcaattggc 120 

ttgcagcaca ttgtcctcta atatccattc aagcttctta gatgatgaaa catttgtcaa 180 

atttattaat ttcatagtgt tcagtctcaa ttctttagct ggttcctcat agtaaagttg 240 

tctaatatga aatgaaaatg ttctgtgtgt tgtactaata ccttttcatg gttgtctata 300 

gaacgtcgat gaagagccaa acagaaacta ttttgggctg cgatttctga taccattgta 360 

•gaatgct gggtgggagc tcatcagaag ctttacaatg ggtcacatat atggagccgg 420 

gaggaat gctgggaatc agttgcgttt cgcgtgctag gacttttcct tcctggtatt 480 

tctgcccaca gcccagttga ttacgtgaac tccgtcagac ttggaaagga gagaagtacc 540 

caaatgtcgt ctttttagaa atacttttgt cacaaaatag cggggtttac agctacagaa 600 

gatcatgcag aaggcgtcca gtttagtttt tgaaggttgt ttggagttta tttatctaaa 660 

gtaaacttaa atcagctttt. tgtttatgag ttcagtgaac tatatgttca aataagactt 720 

ccctttgtag atatgtgttt tttttgttgt tgagcacttt gtgtgcattg gataaacccc 780 

caacgtgtaa tagctaccat acaagagaag taactcgcac tgtccatgtc ttatgtggct 840 

cgactcagaa agcattcagg gggattgata accaccctcc aaaccaactg aaccattgtg 900 

aataaccacc cttcaaatca accgagtcct cgtgaaggac aaatatgtgg ttttatatac 960 

attaaatttt gtttttacat gcttcctctt acttctttag ttttcttgac catatcttgc 1020 

gtttttccct tctgtaattg acacttttct tcaaaccatc cagcaatgtg gaagcttgac 1080 
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gattttcctt cagagtagaa attgaaaaga atcaactaaa aaggatagtc cttcgatttg 1140 

atttccggct taaaaataaa ctaataagaa tgagagagcg aataatagaa tattttgaaa 1200 

ttttaaagat attcaactat gttaaattgc gttataaatt tcttaaatta gtagcaccta 1260 

atagtttagt tctcaaaagt caaaactact acataatgtg ctcatttttc acattaaaat 1320 

gcctacatga tgtaaaagta aaactcgtag cattctacgt gttttactca actcaaacat 1380 

cctgttcatt ttaataaacg tacgatgagc ttctctctcc aattttcttt tctttttttt 1440 

ttttaaaaaa atattttttt ttatatcaat ccaaatgggc tccaatttat cataaattag 1500 

gtagaaactt agatattaaa gaaagaaaag ggtttatctc gcaagtgtgg ctatggtggg 1560 

acgtgtcaaa ttttggattg tagccaaaca tgagatttga tttaaaggga attggccaaa 1620 
tcaccgaaag caggcatctt catcataaat tagtttgttt atttatacag aattatacgc 



1680 



ttttactagt tatagcattc ggtatctttt tctgggtaac tgccaaacca ccacaaattt 1740 



1800 



gtttcca tttaactctt caacttcaac ccaaccaaat ttatttgctt aattgtgcag 

rcactccc tatatcttct aggtgctttc attcgttccg aggtaagaaa agatttttgt 1860 

ttctttgaat gctttatgcc actcgtttaa cttctgaggt ttgtggatct tttaggcgac 1920 

tttttttttt tttgtatgta aaatttgttt cataaatgct tctcaacata aatcttgaca 1980 

aagagaagga attttaccaa gtatttaggt tcagaaatgg ataattttct tactgtgaaa 2040 

tatccttatg gcaggtttta ctgttatttt tcagtaaa 2078 

<210> 8 

<211> 1342 

<212> DNA 

<213> Lycopersicon esculentum 



1> promoter 
<222> (1) . . (1342) 
<223> pds Promotor 

<400> 8 

gttttttttg ttgttgagca ctttgtgtgc attggataaa cccccaacgt gtaatagcta 60 

ccatacaaga gaagtaactc gcactgtcca tgtcttatgt ggctcgactc agaaagcatt 120 

cagggggatt gataaccacc ctccaaacca actgaaccat tgtgaataac cacccttcaa 180 

atcaaccgag tcctcgtgaa ggacaaatat gtggttttat atacattaaa ttttgttttt 240 

acatgcttcc tcttacttct ttagttttct tgaccatatc ttgcgttttt cccttctgta 300 

attgacactt ttcttcaaac catccagcaa tgtggaagct tgacgatttt ccttcagagt 360 
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agaaattgaa aagaatcaac taaaaaggat agtccttcga tttgatttcc ggcttaaaaa 420 

taaactaata agaatgagag agcgaataat agaatatttt gaaattttaa agatattcaa 480 

ctatgttaaa ttgcgttata aatttcttaa attagtagca cctaatagtt tagttctcaa 540 

aagtcaaaac tactacataa tgtgctcatt tttcacatta aaatgcctac atgatgtaaa 600 

agtaaaactc gtagcattct acgtgtttta ctcaactcaa acatcctgtt cattttaata 660 

aacgtacgat gagcttctct ctccaatttt cttttctttt ttttttttaa aaaaatattt 720 

ttttttatat caatccaaat gggctccaat ttatcataaa ttaggtagaa acttagatat 780 

taaagaaaga aaagggttta tctcgcaagt gtggctatgg tgggacgtgt caaattttgg 840 

attgtagcca aacatgagat ttgatttaaa gggaattggc caaatcaccg aaagcaggca 900 

tcttcatcat aaattagttt gtttatttat acagaattat acgcttttac tagttatagc 960 

/ttcggtatc tttttctggg taactgccaa accaccacaa atttcaagtt tccatttaac 1020 

itcaactt caacccaacc aaatttattt gcttaattgt gcagaaccac tccctatatc 1080 

*tctaggtgc tttcattcgt tccgaggtaa gaaaagattt ttgtttcttt gaatgcttta 1140 

tgccactcgt ttaacttctg aggtttgtgg atcttttagg cgactttttt tttttttgta 1200 

tgtaaaattt gtttcataaa tgcttctcaa cataaatctt gacaaagaga aggaatttta 1260 

ccaagtattt aggttcagaa atggataatt ttcttactgt gaaatatcct tatggcaggt 1320 

tttactgtta tttttcagta aa 1342 

<210> 9 
<211> 1008 
<212> DNA 

<213> Lycopersicon esculentum 



^Ttc 



• 

<221: 



<221> promoter 
<222> (1) . . (1008) 
<223> pds Promotor 



<400> 9 

aagcttgacg attttccttc agagtagaaa ttgaaaagaa tcaactaaaa aggatagtcc 60 

ttcgatttga tttccggctt aaaaataaac taataagaat gagagagcga ataatagaat 120 

attttgaaat tttaaagata ttcaactatg ttaaattgcg ttataaattt cttaaattag 180 

tagcacctaa tagtttagtt ctcaaaagtc aaaactacta cataatcgtg ctcatttttc 240 

acattaaaat gcctacatga tgtaaaagta aaactcgtag cattctacgt gttttactca 300 

actcaaacat cctgttcatt ttaataaacg tacgatgagc ttctctctcc aattttcttt 360 
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tctttttttt ttttaaaaaa atattttttt ttatatcaat ccaaatgggc tccaatttat 420 

cataaattag gtagaaactt agatattaaa gaaagaaaag ggtttatctc gcaagtgtgg 480 

ctatggtggg acgtgtcaaa ttttggattg tagccaaaca tgagatttga tttaaaggga 540 

attggccaaa tcaccgaaag caggcatctt catcataaat tagtttgttt atttatacag 600 

aattatacgc ttttactagt tatagcattc ggtatctttt tctgggtaac tgccaaacca 660 

ccacaaattt caagtttcca tttaactctt caacttcaac ccaaccaaat ttatttgctt 720 

aattgtgcag aaccactccc tatatcttct aggtgctttc attcgttccg aggtaagaaa 780 

agatttttgt ttctttgaat gctttatgcc actcgtttaa cttctgaggt ttgtggatct 840 

tttaggcgac tttttttttt tttgtatgta aaatttgttt cataaatgct tctcaacata 900 

aatcttgaca aagagaagga attttaccaa gtatttaggt tcagaaatgg ataattttct 960 



tactgtgaaa tatccttatg gcaggtttta ctgttatttt tcagtaaa 1008 




<212> DNA 

<213> Lycopersicon esculentum 
<220> 

<221> promoter 

<222> CD - • C2078) 
<223> 

^^400> 10 

^gfcgccagta ttacaacagc ttatatgttg agcaggtaaa agcttcaatg ccctattctt 60 

^^Picagtta tcaatgttgc tcgtctaata tctggtgttc ttctcgaaat gtcaattggc 120 

ttgcagcaca ttgtcctcta atatccattc aagcttctta gatgatgaaa catttgtcaa 180 

atttattaat. ttcatagtgt tcagtctcaa ttctttagct gtttcctcat agtaaagttg 240 

tctaatatga aatgaaaatg ttctgtgtgt tgtactaata ccttttcatg gttgtctata 300 

gaacgtcgat gaagagccaa acagaaacta ttttgggctg cgatttctga taccattgta 360 

tctgaatgct gggtgggagc tcatcagaag ctttacaatg ggtcacatat atggagccga 420 

gtatgaggaa tgctgggaat cagttgtgct tcgcgtgcta ggacttttcc ttcctggtat 480 

ttctgcccac agcccagttg attacgtgaa ctccgtcaga cttggaaagg agagaagtac 540 

ccaaatgtcg tctttttaga aatacttttg tcacaaaata gcggggttta cagctacaga 

agatcatgca gaaggcgtcc agtttagttt ttgaaggttg tttggagttt atttatctaa 

agtaaactta aatcagcttt ttgtttatga gttcagtgaa ctatatgttc aaataagact 720 
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tccctttgta gaatatgtgt ttttttttgt tgttgagcac tttgtgtgca ttggataaac 780 

ccccaacgtg taatagctac catacaagag aagtaactcg cactgtccat gtcttatgtg 840 

gctcgactca gaaagcattc agggggattg ataaccaccc tccaaaccaa ctgaaccatt 900 

gtgaataacc acccttcaaa tcaaccgagt cctcgtgaag gacaaatatg tggttttata 960 

tacattaaat tttgttttta catgcttcct cttacttctt tagttttctt gaccatatct 1020 

tctttttccc ttctgtaatt gacattttct tcaaaccatc cagcaatgtg gaagcttgac 1080 

gattttcctt cagagtagaa attgaaaaga atcaactaaa aaggatagtc cttcgatttg 1140 

atttccggct taaaaataaa ctaataagaa tgagagagcg aataatagaa tattttgaaa 1200 

ttttaaagat attcaactat gttaaattgc gttataaatt tcttaaatta gtagcaccta 1260 

atagtttagt tctcaaaagt caaaactact acataatgtg ctcatttttc acattaaaat 1320 

^^ctacatga tgtaaaagta aaactcgtag cattctacgt gttttactca actcaaacat 1380 

■Mpgttcatt ttaataaacg tacgatgagc ttctctctcc aattttcttt tctttttttt 1440 

^fttaaaaaa atattttttt ttatatcaat ccaaatgggc tccaatttat cataaattag 1500 

gtagaaactt agatattaaa gaaagaaaag ggtttatctc gcaagtgtgg ctatggtggg 1560 

acgtgtcaaa ttttggattg tagccaaaca tgagatttga tttaaaggga attggccaaa 1620 

tcaccgaaag caggcatctt catcataaat tagtttgttt atttatacag aattatacgc 1680 

ttttactagt tatagcattc ggtatctttt tctgggtaac tgccaaacca ccacaaattt 1740 

caagtttcca tttaactctt caacttcaac ccaaccaaat ttatttgctt aattgtgcag 1800 

aaccactccc tatatcttct aggtgctttc attcgttccg aggtaagaaa agatttttgt 1860 

ttctttgaat gctttatgcc actcgtttaa cttctgaggt ttgtggatct tttaggcgac 1920 

tttttttttt tttgtatgta aaatttgttt cataaatgct tctcaacata aatcttgaca 1980 

aagagaagga attttaccaa gtatttaggt tcagaaatgg ataattttct tactgtgaaa 2040 

^|fccct:tatg gcaggtttta ctgttatttt tcagtaaa 2078 

^9l0> 11 

<211> 1528 
. <212> DNA 

<213> Cucumis sativus 



<220> 

<221> promoter 

<222> CD - . C1528) 

<223> chrc promotor 



Seite 11 
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tacaaattag ggttacttta ttcattttca 
tttattcaat aatattatat gtttattaca 
ctcaagcctt taccatcttc cttttctatt 
ttttaacatc tttctttatt tcttgtccac 
tcatctctcg tagtaacaca aaaccaatgt 
aataaagtga aacaaaatat ctataaataa 
tcaacccatc aattaaaaaa ttttgttata 
atatttacct tttaaccccc acaaaaaaaa 
ctatttaaat agctaactat aagatcttaa 
gttattaact tataacatta tatatctatg 

•ttttttaact taagaaaata gtcataacat 
ktgattaa caaaaagtta gaaatattta 
tgaatgtt catacgcaga cccatttaga 
tttcaaaact aaggttgtag caatattaaa 
acctgctcgt gtttgctgta tatgggaggc 
gttttagaca ttttttctat ctgtattagt 
ccaattctat tttcgttcct tggtggctgg 
ggttttattg gacttttaat agtatcaaac 
aaatatttag ggtaacctgt tgccgttttt 
cgtattgtgt attcattcat ttggcgcctc 
gccttctttg tatattgtac tccccctctt 
cacgttgcgt gccattgcca aacaagtcat 

•acaacga caagtttccg aacagtcgcg 
atttctc tttatttaat agtccctctc 
gtagctgctg tttaagtaaa tcccagtcct 
ctgatttacg gaatttggaa ataattct 

<210> 12 

<211> 1538 

<212> DNA 

<213> cucumis sativus 
<220> 

<221> promoter 



04sequ . txt 



tccattctct 


ttattgttaa 


attttgtaca 


60 


aattctcact 


ttcttattca 


tacctattca 


120 


tcaatactat 


ttctacttca 


tttttcacgt 


180 


ttcgtttagg 


gatgectaat 


gtcccaaatt 


240 


aatgctactt 


ctctctacat 


ttttaataca 


300 


acaaatatat 


atattttgtt 


agacgctgtc 


360 


tttctacttt 


acctactaaa 


tttgtttctc 


420 


attataaaaa 


agaaagaaaa 


aagctaaacc 


480 


aattatcctc 


atcagtgtat 


agtttaattg 


540 


acatatactc 


tctcctagct 


atttctcaca 


600 


agtctaaaat 


tcaaacatcc 


acatgetcta 


660 


tttaaataaa 


aaagactaat 


aaatatataa 


720 


gatgagtatg 


ctttcacatg 


ctgagattat 


780 


tcaataaaat 


tattataaat 


aacaaaatta 


840 


tacaaaataa 


attaaactaa 


agatgattat 


900 


ttatacatat 


taattcagga gctgcacaac 


960 


gtttctcaca 


aggttcaata 


gtcaatatta 


1020 


aaatctatgt 


gtgaacttaa 


aaattgtatt 


1080 


agaataatgt 


ttcttcttaa tacacgaaag 


1140 


acatgcttcg 


gttggctcgc tttagtctct 


1200 


cctatgccac 


gtgttctgag 


cttaacaagc 


1260 


"t t *t a a r *t l~r* a 


caaggtccga tttgacctcc 




aagatcaagg 


gtataatcgt 


ctttttgaat 


1380 


gtgtgatagt 


ttttaaaaga tttttaaaac 


1440 


tcagtttgtg 


cttttgtgtg ttttgtttct 


1500 








1528 
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<223> chrc Promotor 
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<400> 12 

tacaaattag ggttacttta ttcattttca tccattctct ttattgttaa attttgtaca 60 

tttattcaat aatattatat gtttattaca aattctcact ttcttattca tacctattca 120 

ctcaagcctt taccatcttc cttttctatt tcaatactat ttctacttca tttttcacgt 180 

ttttaacatc tttctttatt tcttgtccac ttcgtttagg gatgcctaat gtcccaaatt 240 

tcatctctcg tagtaacaca aaaccaatgt aatgctactt ctctctacat ttttaataca 300 

aataaagtga aacaaaatat ctataaataa acaaatatat atattttgtt agacgctgtc 360 

tcaacccatc aattaaaaaa ttttgttata tttctacttt acctactaaa tttgtttctc 420 

atatttacct tttaaccccc acaaaaaaaa attataaaaa agaaagaaaa aagctaaacc 480 



r tttaaat agctaactat aagatcttaa aattatcctc atcagtgtat agtttaattg 540 

r tattaact tataacatta tatatctatg acatatactc tctcctagct atttctcaca 600 

ttttttaact taagaaaata gtcataacat agtctaaaat tcaaacatcc acatgctcta 660 

atttgattaa caaaaagtta gaaatattta tttaaataaa aaagactaat aaatatataa 720 

aatgaatgtt catacgcaga cccatttaga gatgagtatg ctttcacatg ctgagattat 780 

tttcaaaact aaggttgtag caatattaaa tcaataaaat tattataaat aacaaaatta 840 

acctgctcgt gtttgctgta tatgggaggc tacaaaataa attaaactaa agatgattat 900 

gttttagaca ttttttctat ctgtattagt ttatacatat taattcagga gctgcacaac 960 

ccaattctat tttcgttcct tggtggctgg gtttctcaca aggttcaata gtcaatatta 1020 

ggttttattg gacttttaat agtatcaaac aaatctatgt gtgaacttaa aaatrtgtatt 1080 

aaatatttag ggtaacctgt tgccgttttt agaataatgt ttcttcttaa tacacgaaag 1140 

•attgtgt attcattcat ttggcgcctc acatgcttcg gttggctcgc tttagtctct 1200 

ttctttg tattttgtac tccccctctt cctatgccac gtgttctgag cttaacaagc 1260 

cacgttgcgt gccattgcca aacaagtcat tttaacttca caaggtccga tttgacctcc 1320 

aaaacaacga caagtttccg aacagtcgcg aagatcaagg gtataatcgt ctttttgaat 1380 

tctatttctc tttatttaat agtccctctc gtgtgatagt tttttaaaga tttttaaaac 1440 

gtagctgctg tttaagtaaa tcccagtcct tcagtttgtg cttttgtgtg ttttgtttct 1500 

ctgatttacg gaatttggaa ataattcttc taaagggc 1538 

<210> 13 
<211> 1525 
<212> DNA 

<213> cucumis sativus 
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<220> 

<221> promoter 

<222> (I) . . (1525) 

<223> CHRC Promotor 



^^ca 



<400> 13 

tacaaattag ggttacttta ttcattttca tccattctct ttattgttaa attttgtaca 60 

tttattcaat aatattatat gtttattaca aattctcact ttcttattca tacctattca 120 

ctcaagcctt taccatcttc cttttctatt tcaatactat ttctacttca tttttcacgt 180 

ttttaacatc tttctttatt tcttgtccac ttcgtttagg gatgcctaat gtcccaaatt 240 

jcatctctcg tagtaacaca aaaccaatgt aatgctacct ctctctacat ttttaataca 300 

aaagtga aacaaaatat ctataaataa acaaatatat atattttgtt agacgctgtc 360 

caacccatc aattaaaaaa ttttgttata tttctacttt acctactaaa tttgtttctc 420 

atatttacct tttaaccccc acaaaaaaaa attataaaaa agaaagaaaa aagctaaacc 480 

ctatttaaat agctagctat aagatcttaa aattatcctc atcagtgtat agtttaattg 540 

gttattaact tataacatta tatatctatg acatatactc tctcctagct atttctcaca 600 

ttttttaact taagaaaata gtcataacat agtctaaaat tcaaacatcc acatgctcta 660 

atttgattaa caaaaagata gaaatattta tttaaataaa aaagactaat aaatatataa 720 

aatgaatgtt catacgcaga cccatttaga gatgagtatg ctttcacatg ttgagattat 780 

tttcaaaact aaggttgtag caatattaaa tcaataaaat tattataaat aacaaaatta 840 

acctgctcgt gtttgctgaa tatgggaggc tacaaaataa attaaactaa agatgattat 900 

gttttagaca ttttttctat ctgtattagt ttatacatat taattcagga gctgcacaac 960 

attctat tttcgttcct tggtggctgg gtttctcaca aggttcaata gtcaatatta 1020 

ftttattg gacttttaat agtatcaaat aaatctatgt gtgaacttaa aaattgtatt 1080 

aaatatttag ggtaacctgt tgccgttttt agaataatgt ttcttcttaa tacacgaaag 1140 

cgtattgtgt attcattcat ttggcgcctc acatgcttcg gttggctcgc tttagtctct 1200 

gccttctttg tattttgtac tccccctctt cctatgccac gtgttctgag cttaacaagc 1260 

cacgttgcgt gccattgcca aacaagtcat tttaacttca caaggtccga tttgacctcc 1320 

aaaacaacga caagtttccg aacagtcgcg aagatcaagg gtataatcgt ctttttgaat 1380 

tctatttctc tttatttaat agtccctctc gtgtgatagt tttttaaaga tttttaaaac 1440 

gtagctgctg tttaagtaaa tcccagtcct tcagtttgtg cttttgtgtg ttttgtttct 1500 

ctgatttacg gaatttggaa ataat 1525 

<210> 14 
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<211> 1519 
<212> DNA 

<213> Cucumis sativus 



<220> 

<221> promoter 

<222> CD . - (1519) 

<223> CHRC Promotor 



<400> 14 

ttactttatt cattttcatc cattctcttt 
tattatatgt ttattacaaa ttctcacttt 

•ktcttcct tttctatttc aatactattt 
tttatttc ttgtccactt cgtttaggga 
gtaacacaaa accaatgtaa tgctacctct 
caaaatatct ataaataaac aaatatatat 
ttaaaaaatt ttgttatatt tctactttac 
taacccccac aaaaaaaaat tataaaaaag 
ctagctataa gatcttaaaa ttatcctcat 
taacattata tatctatgac atatactctc 
agaaaatagt cataacatag tctaaaattc 
aaaagataga aatatttatt taaataaaaa 
tacgcagacc catttagaga tgagtatgct 

•tgtagca atattaaatc aataaaatta 
ttgaata tgggaggcta caaaataaat 
ttttctatct gtattagttt atacatatta 
tcgttccttg gtggctgtgt ttctxacaag 
cttttaatag tatcaaataa atctatgtgt 
taacctgttg ccgtttttag aataatgttt 
tcattcattt ggcgcctcac atgcttcggt 
ttttgtactc cccctcttcc tatgccacgt 
cattgccaaa caagtcattt taacttcaca 
agtttccgaa cagtcgcgaa gatcaagggt 
tatttaatag tccctctcgt gtgatagttt 
taagtaaatc ccagtccttrc agtttgtgct 



attgttaaat 


tttgtacatt tattcaataa 




cttattcata 


cctattcact caagccttta 


t ~>c\ 


ctacttcatt tttcacgttt ttaacatctt 


lOU 


tgcctaatgt 


cccaaatttc atctctcgta 




ctctacattt ttaatacaaa taaagtgaaa 




attttgttag 


acgctgtctc aacccatcaa 




ctactaaatt 


tgtttctcat atttaccttt 




aaagaaaaaa gctaaaccct atttaaatag 


tOU 


cagtgtatag tttaattggt tattaactta 




tcctagctat ttctcacatt ttttaactta 




aaacatccac 


atgctctaat ttgattaaca 


uuu 


agactaataa atatataaaa tgaatgttca 


720 


ttcacatgtt 


gagartattt tcaaaactaa 


780 


ttataaataa 


caaaattaac ctgctcgtgt 


840 


taaactaaag 


atgattatgt tttagacatt 


900 


attcaggagc 


tgcacaaccc aattctattt 


960 


gttcaatagt 


caatattagg ttttattgga 


1020 


gaacttaaaa 


attgtattaa atatttaggg 


1080 


cttcttaata 


cacgaaagcg tattgtgtat 


1140 


tggctcgctt 


tagtctctgc cttctttgta 


1200 


gttctgagct 


taacaagcca cgttgcgtgc 


1260 


aggtccgatt 


tgacctccaa aacaacgaca 


1320 


gtaatcgtct 


ttttgaattc tatttctctt 


1380 


tttaaagatt 


tttaaaacgt agctgctgtt 


1440 


tttgtgtgtt 


ttgtttctct gatttacgga 


1500 



Seite 15 
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atttggaaat aataagctt 

<210> 15 

<211> 1771 

<212> DNA 

<213> Haematococcus pluvial is 
<220> 

<221> CDS 

<222> (166).. (1155) 

<223> 



• 




1519 



,J0> 15 

cacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca 60 

aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 120 

ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 177 

Met Gin Leu Ala 

fn 9 . ^u a g , ta atg ttg 9ag cag ctt acc gga age get qaq qca etc aaa ?:>«; 
Ala Thr val Met Leu Glu Gin Leu Thr Gly sir Ala Glu All lIu lyt 25 

10 15 20 

s?s & its si f?s «a )k a; jg « as aa a 25 as 35 273 

30 35 

B8 ?S SB f SS ffi S3 S l?2 SS S SS JBS fiS 25 S 321 

w 45 50 

ctg aag aat gec tac aag cca cca cct tec aar ara aan nnr a-*-,- 3cn 
Leu Lys ash Ala Tyr Lyl Pro pS Prl Ser ??p Thr lyt %ly ?le 369 
" 60 65 

aca atg gcg eta cgt gtc ate ggc tec tag acc aca ata ttr n-r nr /i 7 
Thr Met Ala Leu Arg Val lie ^Ty ser Trg Ala XS va? Phe SS His 4±? 
/u 75 80 

Ala Til III rin aag F tt ccg acc tcc ttq gac cag ctg cac tgg 465 
Ala lie Phe Gin lie Lys Leu Pro Thr Ser Leu Asp Gin Leu His Trp 

3 90 95 100 

ctg ccc gtq tea gat gee aca get cag ctg gtt aoc qac aca anr anr <n * 

Leu Pro VaT Ser Asp Ala Thr Ala Gin* LeS val ser G?£ Thr sir Ser 
105 HO 115 

ctg etc gac ate gtc gta gta ttc ttt gtc ctg qaq ttc ctq tac am «;ri 
Leu Leu Asp lie Val val Val Phe Phe val LeS ITS Phe £2 Tyr ?hr 61 
x * v 125 130 

G?y Phi ill Thr rh? »il ? at § Ct atg cat ggc acc atc g c <= atg 609 
faiy Leu Phe lie Thr Thr His Asp Ala Met His Gly Thr He Ala Met 



140 145 
seite 16 
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aga aac agg cag ctt aat gac ttc ttg ggc aga gta tac ate tec 1-1-a 
Arg Asn Arg Gin Leu Asn Asp Phe Leu cTy Arg 8al cys lie ler £e§ 
X3U 155 160 



tac gee tgg ttt gat tac aac atg ctg cac cgc aaq cat taa aaa car 
Tyr. Ala Trp Phe Asp Tyr Asn Met Le3 His Arg Lyl His Tr?> §?S 5is 
" L ° 5 170 175 180 

5?^ XS 5L C «? I?! ifg 83 §?£ SI g S SJ SSS j| «- 
as as m fl ?3 SS S? SS |?| £ ffi S3 ler SS ~ S3 

^ UU 205 210 

teg atg tgg cag ttt gcg cgc etc gca tqq tqq aca ata ai-r atn ran 
ser Met Trp Gin Phe Ala Arg Leu ?la T?g Tr? Thr 8a? 8al Set GlS 

220 225 

ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc ata aca arc am 
||u Leu Gly Ala Pro Met Ala Asn LeS LeS 8a? She Set ?la Si a ?la 




240 



?i C P tg £ cc gcc t J c cgc tta ttc tac ttt ggc acg tac ata ccc 
Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe l?y rhr Tyr Set Pro 

45 250 255 260 

£ a S aag £ ct gag cct ggc 9 CC ° c 9 tea ggc tct tea cca acc ate ata 
His Lys Pro Glu Pro Gly Ala Ala Ser cTy ser ser Pro ?la 8al Set 
265 270 275 

i gg ? ag £ cg cgc a , c t age cag gcg tec gac ctg gtc aac ttt 
Asn Trp Trp Lys ser Arg Thr ser Gin All ser Asp CeS 8al ler Phi 
^ ou 285 290 

ctg acc tgc tac cac ttc gac ctg cac tgg gag cac cac cac taa err 
Leu Thr cys Tyr His Phe Asp LeS His Trg §lS 5is 5is A?g Tr? Pro 

300 305 

ohf f?£ ^ cc 3" t9g gag "9 ccc aac tgc cgc cgc ctg tct aac caa 
Phe Ala Pro Trp Trp Glu Leu Pro Asn cys Arg Arg LeS sS G?J Arg 

SS 8al pS Ala ta9 ctggacacac tgcagtgggc cctgctgcca 

gctgggcatg caggttgtgg caggactggg tgaggtgaaa agetgeagge gctgctgccg 
gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 
tegagcttge cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 
acccttgcag gagatgtctt gegtegggag gagtgttggg cagtgtagat gctatgattg 
tatcttaatg ctgaagcett taggggagcg acacttagtg ctgggcaggc aacgccctgc 
aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 
ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 
agagctgegt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 
agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 
ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 

Seite 17 





04sequ.txt 

<210> 16 
<211> 329 
<212> PRT 

<213> Haematococcus pluvial is 
<400> 16 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly ser Ala 
1 5 10 15 

Glu Ala Leu Lys Glu Lys Glu Lys Glu val Ala Gly ser Ser Asp Val 
20 25 30 

Arg Thr Trp Ala Thr Gin Tyr ser Leu Pro ser Glu Glu ser Asp 
35 40 45 

Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 55 60 

Thr Lys Gly lie Thr Met Ala Leu Arg val He Gly ser Trp Ala Ala 
65 70 75 80 

Val Phe Leu His Ala lie Phe Gin lie Lys Leu Pro Thr ser Leu asd 
85 90 95 

Gin Leu His Trp Leu Pro Val ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 110 

Gly Thr ser Ser Leu Leu Asp lie val val val Phe Phe Val Leu Glu 
115 120 125 

Leu Tyr Thr Gly Leu Phe lie Thr Thr His Asp Ala Met His Gly 
130 135 140 

Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg val 
145 150 155 160 

cys He ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys 
165 170 175 

His Trp Glu His His Asn His Thr Gly Glu val Gly Lys Asp Pro Asp 
180 185 190 

Phe His Arg Gly Asn pro Gly lie Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 

Ser ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
210 215 220 

seite 18 
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Val val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu val Phe 

230 235 240 

Met Ala Ala Ala Pro He Leu ser Ala Phe Arg Leu Phe Tyr Phe Glv 
245 250 255 

Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly ser Ser 
^oO 265 270 

Pro Ala Val Met Asn Trp Trp Lys ser Arg Thr Ser Gin Ala Ser Asp 



285 



Leu Val ser Phe Leu Thr C|s Tyr His Phe Asp Leu His Trp Glu 



300 



His 




Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu pro Asn cys Arg Arq 
310 315 u 320 

Leu ser Gly Arg Gly Leu Val pro Ala 
325 

<210> 17 
<211> 1662 
<212> DNA 

<213> Haematococcus pluvial is 



<220> 

<221> CDS 

22> (168) . . (1130) 



^^222 



<400> 17 

cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 60 

gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 120 

ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 176 

Met His Val 
1 

} cg ? ca cta atg gtc gag ca 9 aaa age agt gag gca get act tec 224 
Ala ser Ala Leu Met val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 

s 10 15 

tir ff^ 83i } t9 aga gcg tgg gcg aca cag tat cac a *9 cca tec 272 
ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met Pro ser 

25 30 35 

gag teg tea gac gca get cgt cct gcg eta aag cac gec tac aaa cct 

seite 19 



320 



CTIu ser ser Asp Ala Ala Arg Pro Ala^euTys^ls Ala Tyr Lys Pro 



SSS SB S lip SS 51 l?y Br SS? SS £2 BS BS IB l?y 368 

60 65 

BS Si BS SB 31? SSS S SB SB SR SSS G <B BS Arg 25 SSI 416 

75 80 

B? S S3 Asp S?2 SSS SB S « £? |C 9? a 9 cc aca gcc 464 

ISs s Ks »5 « I ® » - 22 ffi BS SB SB Sf ss 512 

110 2.15 

SS va? 25 H8 1| BS BS §?J 22 SSS BS BS B? SB SB 560 

x " 130 

S3 SS fj BS SR SS S3 Slj SB SS SB 25 SS J5J 25 608 

140 145 

s §? y ss Se gs s; is s§ is a «t fac tac agc a t fl 656 

150 ifc y Ala Trp Phe As P T y p Ser Met 

160 

22 SB SS 52 SB S? fl§ SB SB SS S8 BS 2?S IB 3S? 1?? ™ 

5j sip ss ss ss as si §? y hj ss as s «s ss s? ss 752 

" 190 195 

JIS !S £ S! SSSS S S! B! Si! IS !SS » 3 - 




S SS S3 IS 83 33 SS? sin S|? 21 1?? SB SSS SS? SB SS 848 

1 220 225 

? 25 3S| SSS SS? SS I?! |?S SSS BS 22 IS? |B SSS S?S 25 «* 
SS Sj SSS m B? SS 22 SSS SB 52 SSS ||2 SSS l? y SSS SB ^ 
|B 2? y SSS S?2 3S? SS? SS S? SSS SS IS 5? B? 12S i?2 SB 992 

270 275 

ISS SIS 3S? SS? ||? SSS 22 BS gs SS SB SSS SSS 22 SB Sg 1040 

285 290 

S! 5?s 5f s c SS 3? Se SS SS 38 ?ffi gfS P tg i cc c * c ^ 1088 

295 ,a Tr P Tr P G 'n Leu Pro His cys 

300 305 

cgc cgc ctg tec ggg cgt ggc ctg gtg cct gec ttg gca tga 1130 

Seite 20 



04sgqu txt 

Arg Arg Leu Ser Gly Arg Gly Leu val Pro Ala Leu Ala 
310 315 320 

cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgctac agggtgctgc 1190 

ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 1250 

ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310 

ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 1370 

tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 1430 

gccggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgcac 1490 

acagccaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tcgtgctatt 1550 

gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 1610 

gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 1662 



W 1 



10> 18 

1> 320 

<212> . PRT 

<213> Haematococcus pluvial is 




<400> 18 

Met His val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
* 10 15 

Ala Ala ser ser Pro Asp val Leu Arg Ala Trp Ala Thr Gin Tyr His 
* u 25 30 

Met Pro ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala 
" 40 45 

Lys Pro Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
->u 55 .60 

lie He Gly Thr Trp Thr Ala val Phe Leu His Ala He Phe Gin lie 

/0 75 80 

Arg Leu Pro Thr ser Met Asp Gin Leu His Trp Leu Pro val Ser Glu 
85 90 95 

Ala Thr Ala Gin Leu Leu Gly Gly ser ser ser Leu Leu His He Ala 
xuu 105 110 

Ala Val Phe lie Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe lie Thr 
J " L -> 120 125 

Thr His Asp Ala Met His Gly Thr lie Ala Leu Arg His Arg Gin Leu 

135 140 

seite 21 
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Asn Asp Leu Leu Gly Asn He Cys lie Ser Leu Tyr Ala Trp Phe asp 
145 150 155 160 

Tyr ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 
165 170 175 

Glu val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu val 
180 185 190 

Pro Trp Phe Ala ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205 

210 ^ TPP TPP 215 ^ M ^ Gln 220 ^ Pr ° 



t Ala Asn Leu Leu val Phe Met Ala Ala Ala Pro lie Leu Ser Ala 

230 235 240 



Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 
245 250 255 

Gly pro Ala Ala Gly ser Gin val Met Ala Trp Phe Arg Ala Lys Thr 
260 265 270 

Ser Glu Ala ser Asp val Met ser Phe Leu Thr cys Tyr His Phe Asp 
275 280 285 

Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu 
290 295 300 

Pro His Cys Arg Arg Leu ser Gly Arg Gly Leu val Pro Ala Leu Ala 
305 310 315 320 



^21; 



0> 19 

11> 729 

<212> DNA 

<213> Agrobacterium aurantiacum 
<220> 

<221> CDS 

<222> (1) . . (729) 

<223> 



<400> 19 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec acc age ctg 

Seite 22 
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Met ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr ser Leu 

15 10 15 

?i« 8^1 c~2 2? C 2? C ^ C ^ C 9 ? C g 5 Z tgg ct 9 9 CC ct 9 cat 9tg cat 96 

lie val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His VaT His 
20 25 30 

gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 144 

Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala He Ala 
35 40 45 

aII l£ C P tg 2? 9 P tg a E c tgg ctg tcg 9 tc 99 a tt: 9 ttc atc at c gcg 192 

Asn Phe Leu Gly Leu Thr Trp Leu ser Val Gly Leu Phe lie lie Ala 
50 55 60 

cat gac gcg atg cac ggg tcg gtg gtg ccg ggg cgt ccg cgc gec aat 240 

ms Asp Ala Met his Gly ser VaT val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

??I Si? 2? c £ ag ? tX gt ? ctg tgg ct 9 ta t gec gga ttt tcg tgg 288 

Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe ser Trp 

85 90 95 



c aag atg atc gtc aag cac atg gec cat cac cgc cat gec gga ace 
g Lys Met lie Val Lys Hts Met Ala His His Arg His Ala Gly Thr 
100 105 110 



"Asp 



336 



gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tqq tac acc 384 
Asp Asp Asp Pro Asp Phe Asp His Gly cTy Pro val Arg T?p Tyr Ala 

120 12 5 

a 9C ll c a ? c 99C acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe lie Gly Thr Tyr phe cTy Trp Arg Glu cTy Leu Leu Leu Pro 
130 135 140 

S=i a n C 8*? ?£ g 8*5 tat g ? g ctg a ? c ctt g gg gat cgc tgg atg tac 480 
val lie val Thr val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

8»? 8*? ll c l" ccg ctg ccg tc 9 at c ctg gcg tcg atc cag ctg ttc 528 
VaT val Phe Trp Pro Leu Pro ser lie Leu Ala Ser lie Gin Leu Phe 
165 170 175 

83? ££S 2? c 25 c l" ctg cc 9 cac cgc ccc ggc cac gac gcg ttc ccg 576 
val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
^ 180 185 190 

R » gc ?,* c aat 9cg cgg tc 9 tc 9 egg atc age gac ccc gtg tcg ctg 624 
sp Arg ms Asn Ala Arg Ser Ser Arg lie ser Asp Pro val ser Leu 
195 200 205 

?!?. tu C ^ gc cac t J t ggc ggt tat cat cac gaa cac cac ctg cac 672 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

d^S 8 tg £ cg i gg tgg cgc ctg ccc a 9C acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 7?q 
Thr Ala 729 



<210> 20 
<211> 242 

seite 23 



<212> PRT 

<213> Agrobacterium aurantiacum 



04sequ.txt 



<400> 20 



Met ser Ala His Ala Leu pro Lys Ala Asp Leu Thr Ala Thr ser Leu 

■*• 5 10 i c 



15 



He val ser Gly Gly He He Ala Ala Trp Leu Ala Leu His val His 
^° 25 30 

Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala He Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu ser val Gly Leu Phe lie lie Ala 



• 



55 



60 



Asp Ala Met His Gly ser Val val pro Gly Arg Pro Arg Ala Asn 
70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe ser Trp 

ob iMi — 



90 



95 



Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp phe Asp His Gly Gly Pro val Arg Trp Tyr Al 



120 



125 



Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
xso 135 140 



^^al 



val lie val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 



160 



al val Phe Trp Pro Leu Pro ser He Leu Ala ser lie Gin Leu Phe 
165 170 175 



val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

Asp Arg His Asn Ala Arg Ser Ser Arg lie ser Asp pro Val Ser Leu 
iy:> 200 205 

Leu Thr cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
^10 215 220 



Pro Thr val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 



230 



235 



240 
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Thr Ala 



<210> 21 

<211> 1631 

<212> DNA 

<213> Alcali genes sp. 

<220> 

<221> CDS 

<222> (99) . . (827) 

<223> 



q 



0> 21 

gcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gqa egg aag cct 116 

Met Ser G I y Arg Lys Pro 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg ace gee gcg ate 164 
Gly Thr Thr Gly Asp Thr He val Asn Leu Gly Leu Thr Ala Ala lie 
10 15 20 

ctg ctg tgc tgg ctg gtc ctg cac gec ttt acg eta tgg ttg eta gat 212 
Leu Leu cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp 
25 30 35 

gcg gee gcg cat ccg ctg ctt gec gtq ctg tgc ctg get ggg ctg ace 260 
Ala Ala Ala His Pro Leu Leu Ala val Leu Cys Leu Ala Gly Leu Thr 
40 45 50 

tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg 308 
Trp Leu ser val Gly Leu Phe lie lie Ala His Asp Ala Met His Gly 

60 65 70 



^^^^ 



fc gtq gtq ccg ggg egg ccg cgc gee aat gcg gcg ate ggg caa ctg 356 

r val val Pro Gly Arg Pro Arg Ala Asn Ala Ala lie Gly Gin Leu 
75 80 85 

gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gec aag 404 

Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu lie Ala Lys 

90 95 100 

cac atg acg cat cac egg cac gee ggc acc gac aac gat ccc gat ttc 452 

His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe 
105 110 115 

ggt cac gqa ggg ccc gtq cgc tgg tac ggc age ttc gtc tec acc tat 500 

Gly his Gly Gly Pro val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 

ttc ggc tgg cga gag gqa ctg ctg eta ccg gtg ate gtc acc acc tat 548 

Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val lie val Thr Thr Tyr 
135 140 145 150 

gcg ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 596 

Seite 25 
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Ala Leu He Leu Gly Asp Arg Trp Met Tyr val He Phe Trp Pro val 

155 160 165 

ccg gee gtt ctg gcg teg ate cag att ttc gtc ttc gga act tag ctq 644 

pro Ala val Leu Ala ser He Gin lie Phe Val Phe Gly Thr Trp Leu 
170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 692 

Pro His Arg Pro cTy ms Asp Asp Phe Pro Asp Arg His Asn All Arg 
185 190 195 M 

teg acc ggc ate ggc gac ccg ttg tea eta ctg ace tgc ttc cat ttc 740 

Ser TKn Gty 11 e G " y Asp Pro Leu Ser Leu Le " Thr cys Phe His Phe 
200 205 210 

§? c 9? c i at c ? c c ? c 9aa cat cac ctg cat ccg cat gtg ccg tqq tag 788 

Gty Gty Tyr ms His Glu His His Leu His Pro His vaT PrS Tr5 Trp 
215 220 225 230 



cgc ctg cct cgt aca cgc aag acc gga ggc cqc 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arq 


gca tga cgcaattcct 
Ala 


Oj/ 




j < k 




240 








Ipttgtcgtg 


gcgacagtcc 


tcgtgatgga 


gctgaccgcc 


tattccgtcc 


acegctggat 


897 


^atgeaegge 


cccctaggct 


ggggctggca 


caagtcccat 


cacgaagagc 


acgaccacgc 


957 


gttggagaag 


aacgacctct 


aeggegtegt 


ettcgeggtg 


ctggcgacga 


tcctcttcac 


1017 


cgtgggcgcc 


tattggtggc 


cggtgctgtg 


gtggatcgcc 


ctgggcatga 


eggtctatgg 


1077 


gttgatctat 


ttcatcctgc 


aegaeggget 


tgtgcatcaa 


cgctggccgt 


tteggtatat 


1137 


tccgcggcgg 


ggctatttcc 


gcaggctcta 


ccaagctcat 


cgcctgcacc 


aegeggtega 


1197 


ggggegggae 


cactgcgtca 


getteggett 


catctatgcc 


ccacccgtgg 


acaagctgaa 


1257 


gcaggatctg 


aageggtegg 


gtgtcctgcg 


cccccaggac 


gagegtcegt 


cgtgatctct 


1317 


gatcccggcg 


"tggccgcatg 


aaatccgacg 


tgctgctggc 


aggggcegge 


cttgccaacg 


1377 


gaetgatege 


getggegate 


cgcaaggcgc 


ggcccgacct 


tcgcgtgctg 


ctgctggacc 


1437 


gtgcggcggg 


cgcctcggac 


gggcatactt 


ggtcctgcca 


cgacaccgat 


ttggcgccgc 


1497 


fctggctgga 


ccgcctgaag 


ccgatcaggc 


gtggcgactg 


gcccgatcag 


gaggtgcggt 


1557 


prccagacca 


ttcgegaagg 


ctccgggccg 


gatatggctc 


gatcgaeggg 


egggggctga 


1617 


tgcgtgcggt 


gacc 










1631 



<210> 22 
<211> 242 
<212> PRT 

<213> Alcali genes sp. 
<400> 22 

Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr lie Val Asn Leu 
5 10 15 
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Gly Leu Thr Ala Ala lie Leu Leu cys Trp Leu val Leu His Ala Phe 
20 25 30 

Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 
35 40 45 

Cys Leu Ala Gly Leu Thr Trp Leu ser val Gly Leu Phe lie He Ala 
50 55 60 

His Asp Ala Met His Gly ser val val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

Ala Ala He Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe ser Trp 
85 90 95 




Pro Lys Leu lie Ala Lys His Met Thr His His Arg His Ala Gly Thr 
100 105 ~ 110 



p Asn Asp Pro Asp Phe Gly His Gly Gly pro val Arg Trp Tyr Gly 
H5 120 125 



Ser Phe val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



val He val Thr Thr Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 



150 



155 



160 



Val He Phe Trp Pro val Pro Ala Val Leu Ala Ser He Gin lie Phe 

165 170 175 

val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro 
180 185 190 



^Leu 



sp Arg His Asn Ala Arg ser Thr Gly lie Gly Asp Pro Leu Ser Leu 
195 200 205 



eu Thr cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly 
225 230 235 240 

Arg Ala 



<210> 23 

<211> 729 

<212> DNA 

<213> Paracoccus marcusii 
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<220> 

<221> CDS 

<222> (1) . . (729) 

<223> 



<400> 23 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec aca age ctg 48 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr ser Leu 
1 5 10 15 



ate gtc teg ggc ggc ate ate gee gca tgg ctg gee ctg cat gtg cat 
lie val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His vat His 
20 25 30 





ctg acc tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

seite 28 



96 



gcg ctg tgg ttt ctg gac gcg gcg gec cat ccc ate ctg gcg gtc geg 144 
"a Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala Val Ala 
35 40 45 

t ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu ser val Gly Leu Phe He lie Ala 
50 55 60 

cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ccg cgc gec aat 240 
His Asp Ala Met His Gly ser Val val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu val Leu Trp Leu Tyr Ala Gly Phe ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gee gga acc 336 
Arg Lys Met lie val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 

gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gee 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

ttc ate ggc acc tat ttc gqc tgg cgc gag ggg ctg ctg ctg ccc 432 
Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 ~ 140 

gtc ate gtg acg gtc tat gcg ctg ate ctg ggg. gat cgc tgg atg tac 480 
Val lie Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc ttc tgg ccg ttg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser lie Leu Ala ser lie Gin Leu Phe 
165 170 175 

gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

gac cgc cat aat gcg egg teg teg egg ate age gac cct gtg teg ctg 624 
Asp Arg His Asn Ala Arg ser ser Arg lie ser Asp Pro val ser Leu 
195 200 205 



672 



04sequ.txt 



ccg acg gtq ccg tgg tgg cgc ctg ccc age acc cgc acc aag gqg gac 
Pro Thr Val Pro Trp Trp Arg Leu Pro ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 



720 




acc gca tga 729 
Thr Ala 



<210> 24 

<211> 242 

<212> PRT 

<213> Paracoccus marcusii 



<400> 24 

.t Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
5 10 15 

lie Val ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His val His 
20 25 30 

Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala val Ala 
35 40 45 

Asn Phe Leu Gly Leu Thr Trp Leu ser Val Gly Leu Phe lie lie Ala 
50 55 60 

His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 ~ 80 

Ala Ala Met Gly Gin Leu val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

Lys Met lie val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 ~ 110 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro val Arg Trp Tyr Ala 
115 120 125 

Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

Val He Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

val val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser lie Gin Leu Phe 
165 170 175 

Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 
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Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 ~ 200 205 

Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 " 235 240 

Thr Ala 



<210> 25 

<211> 1629 

12> DNA 

13> Synechococysti s 
<220> 

<221> CDS 

<222> (1). .(1629) 

<223> 

<400> 25 

atg ate acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta 
Met lie Thr Thr Asp Val Val lie lie Gly Ala Gly His Asn Gly Leu 
1 5 10 15 

gtc tgt gca gec tat ttg etc caa egg ggc ttg ggg gtg acg tta eta 
' al cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly val Thr Leu Leu 
20 25 30 




^lu 



aag egg gaa gta cca ggg ggg gcg gec acc aca gaa get etc atg 
lu Lys Arg Glu val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 . 40 45 

ccg gag eta tec ccc cag ttt cgc ttt aac cgc tgt gec att gac cac 
Pro Glu Leu ser Pro Gin Phe Arg Phe Asn Arg cys Ala lie Asp His 
50 55 60 

gaa ttt ate ttt ctg ggg ccg gtg ttg cag gag eta aat tta gec cag 
Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 75 80 

tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg 
Tyr Gly Leu Glu Tyr Leu Phe cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 

ctg gat ggc caa get ttt atg age tac cgt tec eta gaa aaa acc tgt 
Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr cys 
100 105 110 

gec cac att gee acc tat age ccc cga gat gcg gaa aaa tat egg caa 
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Ala His lie Ala Thr Tyr ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 

2* 3*5 aat tat tgg a F g gat tt 9 ctc aac 9 ct gtc cag cct get ttt 432 
Phe yal Asn Tyr Trp Thr Asp Leu Leu Asn Ala val Gin Pro Ala Phe 
130 135 140 

aat St* £ cg £ cc cag g f t tta cta gat tta 9 CC ct 9 aac tat ggt tgg 480 
Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
1^5 150 155 160 

gaa aac tta aaa tec gtg ctg gcg ate gec ggg teg aaa ace aag gcg 528 
Glu Asn Leu Lys ser val Leu Ala He Ala GTy ser Lys Thr Lys All 
165 170 175 

ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg ctc aat 576 
Leu Asp Phe lie Arg Thr Met lie Gly Ser Pr5 Glu Asp VaT Leu Asn 
180 185 190 

gaa tgg ttc gac age gaa egg gtt aaa get cct tta get aga cta tgt 624 
Glu Trp Phe Asp ser Glu Arg val Lys Ala Pro Leu Ala Arg Leu cys 
195 200 205 

9 gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 672 
r Glu He Gly Ala Pro Pro ser Gin Lys GTy ser Ser Ser Gly Met 
210 215 220 

2*2 2*2 gt ? g ? c atg cgg cat ttg gag g 9 a att 9cc aga cca aaa gga 720 
Met Met vaT Ala Met Arg His Leu Glu Gly lie Ala Arg Pro Lys cly 
225 230 235 y 240 

? gc Sf* ?? a g ? c ctc a E a 9aa gec ttg gtg aag tta gtg caa gee caa 768 
Gly Thr Gly Ala Leu Thr Glu Ala Leu val Lyi Leu Val Gin Ala Gin 
2 45 250 255 

ggg gga aaa ate ctc act gac caa ace gtc aaa egg gta ttg gtg gaa 816 
Gly Gly Lys lie Leu Thr Asp Gin Thr Val Lys Arg Val Leu vaT Glu 
260 265 270 

a ™ aaC £? g ?? 9 atc ggg gtg ga 9 gta get aac gga gaa cag tac egg 864 
Asn Asn Gin Ala lie Gly val Glu val Ala Asn Gly Glu Gin Tyr Arq 
275 280 285 

gec aaa aaa gac gtg att tct aac ate gat gec cgc cgt tta ttt ttg 912 

41 a kXS Lys GTy VaT I1e Ser Asn Ile As P Ala Arg Arg Leu Phe Leu 
*^ 2 90 295 300 



^ In 



ttg gtg gaa ccg ggg gec cta gec aag gtg aat caa aac cta ggg 960 
n Leu Val Glu Pro Gly Ala Leu Ala Lys val Asn Gin Asn Leu Gly 
305 310 315 320 

gaa cga ctg gaa egg cgc act gtg aac aat aac gaa gec att tta aaa 1008 
Glu Arg Leu Glu Arg Arg Thr val Asn Asn Asn Glu Ala lie Leu Lys 
325 330 335 

ate gat tgt gec ctc tec ggt tta ccc cac ttc act gee atg gee ggg 1056 
lie Asp cys Ala Leu ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 

ccg gag gat cta acg gga act att ttg att gee gac teg gta cgc cat 1104 
Pro Glu Asp Leu Thr Gly Thr lie LeO lie Ala Asp Ser Val Arg His 
355 360 365 

v 9 /3i 2 ag 2 aa 2i c » ac g ? c ctc a l t g ? c ttg ggg caa att ccc gat get 1152 
Val Glu Glu Ala His Ala Leu lie Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 

aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc ace atg 1200 
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Asn Pro ser Leu Tyr Leu Asp lie Pro Thr val Leu Asp Pro Thr Met 
385 390 395 400 

gcc ccc cct ggg cag cac acc etc tgg ate gaa ttt ttt gee ccc tac 1248 
Ala Pro pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 

cgc ate gee ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc 1296 
Arg lie Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

R? 9 . } ta aag 2 aa aaa gt 9 g ? g 9 at c 99 9tg att gat aaa tta acg 1344 
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg val lie Asp Lys Leu Thr 
435 440 445 

gac tat gcc cct aac eta aaa tct ctg ate att ggt cgc cga gtg gaa 1392 
Asp Tyr Ala Pro Asn Leu Lys ser Leu lie lie Gly Arg Arg val Glu 

IX ?if fif, ?!?. ?? c £ aa ^ gg ctg g ? a agt tac aac 99 c aat 9tc 1440 
ser Pro Ala Glu Leu Ala Gin Arg Leu Gly ser Tyr Asn Gly Asn val 

465 470 475 480 



cat ctg gat atg agt ttg gac caa atg atg ttc etc egg cct eta 1488 

r His Leu Asp Met ser Leu Asp Gin Met Met Phe Leu Arq Pro Leu 
485 490 495 

ccg gaa att gcc aac tac caa acc ccc ate aaa aat ctt tac tta aca 1536 

Pro Glu He Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
500 505 510 

999 gcg ggt acc cat ccc ggt ggc tec ata tea ggt atg ccc ggt aga 1584 

Gly Ala Gly Thr His Pro G?y Gly Ser lie ser Gly Met Pro Gly Arg 
515 520 525 

aat tgc get egg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa 1629 

Asn cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 

530 535 540 , 



— £2 1 



<210> 26 

<211> 542 

^212> PRT 

3> synechococysti s 



<400> 26 

Met lie Thr Thr Asp Val val He lie Gly Ala Gly His Asn Gly Leu 
1 5 10 15 

Val cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 

Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 

Pro Glu Leu ser Pro Gin Phe Arg Phe Asn Arg cys Ala lie Asp His 
50 55 60 
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Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 75 80 

Tyr Gly Leu Glu Tyr Leu Phe cys Asp Pro ser val Phe Cys Pro Gly 
85 90 95 

Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg ser Leu Glu Lys Thr cys 
100 105 " 110 

Ala His lie Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 

Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 




Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 



u Asn Leu Lys ser Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 
165 170 175 



Leu Asp Phe He Arg Thr Met lie Gly ser Pro Glu Asp val Leu Asn 
180 185 190 

Glu Trp Phe Asp ser Glu Arg val Lys Ala Pro Leu Ala Arg Leu cys 
195 200 205 

ser Glu lie Gly Ala Pro Pro ser Gin Lys Gly Ser ser Ser Gly Met 
210 215 220 

Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
225 230 235 240 



m 



fly Thr Gly Ala Leu Thr Glu Ala Leu val Lys Leu val Gin Ala Gin 
245 250 255 



Gly Gly Lys lie Leu Thr Asp Gin Thr val Lys Arg Val Leu val Glu 
260 265 270 



Asn Asn Gin Ala lie Gly val Glu val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 

Ala Lys Lys Gly val lie Ser Asn lie Asp Ala Arg Arg Leu Phe Leu 
290 295 300 

Gin Leu val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 

Glu Arg Leu Glu Arg Arg Thr val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 
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lie Asp cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 

pro Glu Asp Leu Thr Gly Thr lie Leu lie Ala Asp ser val Arg His 
355 360 365 

val Glu Glu Ala His Ala Leu lie Ala Leu Gly Gin lie Pro Asp Ala 
370 375 380 

Asn Pro ser Leu Tyr Leu Asp lie Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 

Ala Pro Pro Gly Gin His Thr Leu Trp lie Glu Phe Phe Ala Pro Tyr 
405 410 415 

Arg lie Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

p Glu Leu Lys Glu Lys Val Ala Asp Arg val lie Asp Lys Leu Thr 
435 440 445 

Asp Tyr Ala Pro Asn Leu Lys Ser Leu lie lie Gly Arg Arg val Glu 
450 455 460 

ser Pro Ala Glu Leu Ala Gin Arg Leu Gly ser Tyr Asn Gly Asn Val 
465 470 475 480 

Tyr His Leu Asp Met ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 

Pro Glu lie Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr 
500 505 510 

ly Ala Gly Thr His Pro Gly Gly ser lie ser Gly Met Pro Gly Arg 
515 520 525 

Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 

<210> 27 

<211> 776 

<212> DNA 

<213> Bradyrhizobium sp. 



<220> 

<221> CDS 

<222> (1) - . (774) 
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<223> 



<400> 27 

atg cat gca gca acc gcc aag get act gag ttc ggg gec tct egg cgc 
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arq Arq 
1 5 10 15 



qc teg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 

ly Ser Leu Val Pro Phe Lys Pro Gin val Asn Arg Arg lie Gly Gin 
85 90 95 

etc tgc ctg ttc etc tat gcc ggg ttc tec ttc gac get etc aat gtc 

Leu cys Leu Phe Leu Tyr Ala Gly Phe ser Phe Asp Ala Leu Asn Val 
100 105 110 




ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc acc 
Leu Phe Trp Ala Leu Pro Gly Leu Leu ser Ala Leu Gin Leu Phe Thr 
180 185 190 

ttc ggc acc tat ctg ccg cac aag ccg gcc acg cag ccc ttc gcc gat 
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 



48 



gac gat gcg agg cag cgc cgc gtc gqt etc acg ctg gcc gcg gtc ate 96 
Asp Asp Ala Arg Gin Arg Arg val Gly Leu Thr Leu Ala Ala Val lie 
20 25 30 

ate gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg 144 
lie Ala Ala Trp Leu Val Leu His val Gly Leu Met Phe Phe Trp Pro 
35 40 45 

ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag 192 
Leu Thr Leu His ser Leu Leu Pro Ala Leu Pro Leu Val val Leu Gin 
50 55 60 



acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 240 
-hr Trp Leu Tyr val Gly Leu Phe lie lie Ala His Asp Cys Met His 
" 70 75 80 



288 



336 



gag cac cac aag cat cac cgc cat ccc ggc acg gcc gag gat ccc gat 384 
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 

ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc age ttt 432 
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala ser Phe 
130 135 140 

ttc ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gca gcc gtc 480 
Phe Leu His Tyr Phe Gly Trp Lys Gin val Ala lie lie Ala Ala Val 
145 150 155 160 

g ctg gtt tat cag etc gtc ttc gcc gtt ccc ttg cag aac ate ctg 528 
|r Leu val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn lie Leu 
165 170 175 



576 



624 



cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg teg ctg ctg 672 

Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 

210 " 215 220 

acc tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat 720 

Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 

225 230 235 240 

gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gcc ctg gaa agg 768 

Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arq 

245 250 255 
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cgt gac ta 
Arg Asp 



<210> 28 

<211> 258 

<212> PRT 

<213> Bradyrhizobium sp. 

<400> 28 



Met His Ala Ala Thr Ala Lys Ala Thr Glu phe Gly Ala Ser Arg Arg 
1 5 10 15 



p Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 
20 25 30 




lie Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 

Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu val val Leu Gin 
50 55 60 

Thr Trp Leu Tyr Val Gly Leu Phe lie lie Ala His Asp cys Met His 
65 70 75 80 

Gly ser Leu val Pro Phe Lys Pro Gin val Asn Arg Arg lie Gly Gin 
85 90 95 

Leu cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn val 
100 105 110 

u His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 

Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala ser Phe 
130 135 140 

Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala lie lie Ala Ala Val 
145 150 155 160 

Ser Leu val Tyr Gin Leu val Phe Ala Val Pro Leu Gin Asn lie Leu 
165 170 175 

Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 

Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 
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Arg His Asn Ala Arg Thr ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 

Thr cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
245 250 255 

Arg Asp 



<210> 29 

<211> 777 

12> DIM A 

13> Nostoc sp. 



<220> 

<221> CDS 

<222> (I) . . (777) 

<223> 



<400> 29 

atg gtt cag tgt caa cca tea tct ctg cat tea gaa aaa ctg gtg tta 
Met val Gin Cys Gin Pro ser ser Leu His Ser Glu Lys Leu val Leu 



10 15 




etc tea ata gat aca tee ata att cat aag age tta tta gqt ata gee 

Leu ser lie Asp Thr Ser lie lie His Lys ser Leu Leu Gly lie Ala 
50 55 60 

atg ctt tgg cag ace ttc tta tat aca gqt tta ttt att act get cat 

Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ala His 

65 70 75 80 



ttt ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 
Phe lie Gly Lys Leu Thr Leu lie Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 



48 



ttg tea teg aca ate aga gat gat aaa aat att aat aag gqt ata ttt 96 

Leu ser ser Thr lie Arg Asp Asp Lys Asn lie Asn Lys Gly lie Phe 
^ 20 25 30 

t gee tgc ttt ate tta ttt tta tgg gca att agt tta ate tta tta 144 

lie Ala Cys Phe lie Leu Phe Leu Trp Ala lie ser Leu lie Leu Leu 

35 40 45 



192 



240 



gat gec atg cac gqe gta gtt tat ccc aaa aat ccc aga ata aat aat 288 
Asp Ala Met His Gly val val Tyr Pro Lys Asn Pro Arg lie Asn Asn 
85 90 95 



336 



gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 384 
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Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 

i-t-a oac cct aat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 
leu lip Pro Asp Tyr Tyr Asn Hty His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

tat eta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 
Tyr Leu His Phe Met Lys ser Tyr Trp Arg Trp Thr Gin lie Phe Gly 
- 150 155 lou 



145 



tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 
Leu val Met lie Phe His Gly Leu Lys Asn Leu val His He Pro Glu 
165 170 175 

aat aat tta att ata ttt tgg atg ata cct tct att tta agt tea gta 
III III CeS lie lie Phe T?p Met lie Pro Ser He Leu ser Ser val 
180 185 190 

caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro his Lys Lys Leu Glu Gly 
195 200 205 

it tat act aac ccc cat tgt gcg cgc agt ate cca tta cct ctt ttt 
y Tyr Thr Asn Pro His Cys Ala Arg Ser lie Pro Leu Pro Leu Phe 
210 215 220 

tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 
Trp ser Phe val Thr cys Tyr His Phe Gly Tyr His Lys Glu His ms 




gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 
Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys lie 
245 250. 255 




tct tta taa 
Ser Leu 



<210> 30 

<211> 258 

212> PRT 

13> Nostoc sp. 



<400> 30 

Met Val Gin Cys Gin Pro Ser ser Leu His Ser Glu Lys Leu val Leu 
15 10 15 

Leu Ser Ser Thr He Arg Asp Asp Lys Asn lie Asn Lys Gly He Phe 
20 25 30 

lie Ala cys Phe lie Leu Phe Leu Trp Ala lie ser Leu lie Leu Leu 
35 40 45 

Leu ser lie Asp Thr ser lie lie His Lys Ser Leu Leu Gly lie Ala 
50 55 60 

seite 38 



432 

480 

528 

576 

624 

672 



768 
777 



04sequ.txt 

Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ala His 
65 70 75 80 

Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg lie Asn Asn 
85 90 95 

Phe lie Gly Lys Leu Thr Leu lie Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 

Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 

Leu Asp pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 



Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin lie Phe Gly 
45 150 155 160 



u Val Met He Phe His Gly Leu Lys Asn Leu Val His lie Pro Glu 
165 170 175 

Asn Asn Leu lie lie Phe Trp Met lie Pro Ser lie Leu Ser Ser Val 
180 185 190 

Gin Leu Phe Tyr Phe Gly Thr phe Leu Pro His Lys Lys Leu Glu Gly 
195 . 200 205 

Gly Tyr Thr Asn Pro His Cys Ala Arg Ser lie Pro Leu Pro Leu Phe 
210 215 " 220 

Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 

Ju Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys lie 
k 245 250 255 

Ser Leu 



<210> 31 

<211> 831 

<212> DNA 

<213> Haematococcus pluvial is 

<220> 

<221> CDS 

<222> (1)..(831) 

Seite 39 




04sequ.txt 

<223> 



<400> 31 

atg cca tec gag teg tea gac gca get cgt cct gtg ttg aag cac gee 

Met Pro ser Glu Ser ser Asp Ala Ala Arg Pro val Leu Lys His Ala 
15 10 15 



la Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His lie Ala 
* 70 75 80 



aat gat etc ctt ggc aac ate tgc ata tea ctg tac gee tgg ttt gac 
Asn Asp Leu Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Trp Phe Asp 
115 120 125 

tac age atg cac tgg gag cac cac aac cat act gqc gaa gtg ggg aaa 
Tyr ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys 
130 135 140 

gac cct gac ttc cac aaa gga aat cct gqc ctt gtc ccc tgg ttc gee 
Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu val Pro Trp Phe Ala 
145 150 155 160 



tgg tgg gca gtg gtg atg caa acg ttg ggg gec ccc atg gcg aat etc 
Trp Trp Ala Val Val Met Gin Thr Leu Gly Ala Pro Met Ala Asn Leu 
180 185 190 



tac ttc gqc act tac ctg cca cac aag cct gag cca gqc cct gca gca 
Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala 
210 215 220 

gqc tct cag gtc atg tct tgg ttc agg gee aag aca agt gag gca tct 
Gly Ser Gin val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala ser 
225 230 ^ 235 240 

gat gtg atg age ttc ctg aca tgc tac cac ttt gac ctg ttt gee ccc 
Asp val Met ser Phe Leu Thr Cys Tyr His Phe Asp Leu Phe Ala Pro 
245 250 255 

seite 40 



48 



tat aaa cct cca gca tct gac gee aag gqc ate act atg gcg ctg ace 96 
Tyr Lys Pro Pro Ala ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
20 25 30 

ate att ggc ace tgg ace gca gtg ttt tta cac gca ata ttc caa ate 144 
lie lie Gly Thr Trp Thr Ala val Phe Leu His Ala lie Phe Gin lie 
35 40 45 

agg eta ccg aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa 192 
Arg Leu Pro Thr ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
50 55 60 

gee aca gee cag ctg ttg gc}c gga age age age eta ttg cac ate gee 240 



= ca gtc ttc att gta ctt gag ttt ctg tac act ggt eta ttc ate acc 288 

Ala val Phe lie Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe lie Thr 
85 90 95 

acg cat gat gca atg cat ggc acc ata get ttg agg aac agg cag etc 336 

Thr His Asp Ala Met His Gly Thr lie Ala Leu Arg Asn Arg Gin Leu 
100 105 110 



384 



432 



480 



c ttc atg tec age tac atg tec ctg tgg cag ttt gee egg ctg gca 528 
Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu Ala 
165 170 175 



576 



eta gtc ttc atg get gca gee cca ate ttg tea gca ttc cgc etc ttc 624 
Leu Val Phe Met Ala Ala Ala Pro lie Leu ser Ala Phe Arg Leu Phe 
195 200 205 



672 



720 



768 



04sequ.txt 

tgg tgg cag ctg ccc cac tgc cgc cgc ctg tct ggg cgt ggc ctg gtq 
Trp Trp Gin Leu Pro His cys Arg Arg Leu Ser Gly Arg Gly Leu Val 
260 265 270 



<400> 32 



t Pro ser Glu Ser Ser Asp Ala Ala Arg Pro Val Leu Lys His Ala 
5 10 15 



Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
20 25 30 

lie lie Gly Thr Trp Thr Ala val Phe Leu His Ala lie Phe Gin lie 
35 40 45 

Arg Leu Pro Thr ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
50 55 60 

Ala Thr Ala Gin Leu Leu Gly Gly Ser ser Ser Leu Leu His lie Ala 
65 70 75 80 

Ala val Phe lie val Leu Glu Phe Leu Tyr Thr Gly Leu Phe lie Thr 
85 90 95 

Ir His Asp Ala Met His Gly Thr lie Ala Leu Arg Asn Arg Gin Leu 
100 105 110 

Asn Asp Leu Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Trp Phe Asp 
115 120 125 

Tyr ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys 
130 135 140 

Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe Ala 
145 150 155 160 

Ser Phe Met Ser Ser Tyr Met ser Leu Trp Gin Phe Ala Arg Leu Ala 
165 170 175 

Trp Trp Ala val val Met Gin Thr Leu Gly Ala Pro Met Ala Asn Leu 
180 185 190 

Seite 41 




816 



cct gcc ttg gca tga 831 
Pro Ala Leu Ala 
275 

<210> 32 

<211> 276 

<212> PRT 

<213> Haematococcus pluvial is 




04sequ.txt 

Leu val Phe Met Ala Ala Ala Pro lie Leu ser Ala Phe Arg Leu Phe 
195 200 205 

Tvr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala 
210 215 220 

Glv Ser Gin Val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala Ser 
225 230 235 240 

Asp Val Met ser Phe Leu Thr cys Tyr His Phe Asp Leu Phe Ala Pro 
245 250 255 

Trp Trp Gin Leu Pro His Cys Arg Arg Leu ser Gly Arg Gly Leu Val 
260 265 270 

ro Ala Leu Ala 
275 



<210> 


33 


<211> 


729 


<212> 


DNA 


<213> 


paracoccus 


<220> 




<221> 


CDS 


<222> 


(1) . . C729) 




<223> 



00> 33 

age gca cat gec ctg ccc aag gca gat ctg acc gee acc age ctg 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr ser Leu 
15 10 15 

ate gtc teg gqc gqc ate ate gec get tgg ctg gee ctg cat gtg cat 
lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His val His 
20 25 30 

gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala lie Ala 
35 40 45 



aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He lie Ala 
50 55 60 

cat gac gcg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gee aat 
His asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 

Seite 42 



48 



96 



192 



240 



288 



04sequ.txt 

Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gec cat cac cgc cat gec gqa acc 
Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 ™ 110 




gac cgc cac aat gcg egg teg teg egg ate age gac ccc gtg teg ctg 
Asp Arg His Asn Ala Arg Ser ser Arg lie Ser Asp Pro Val ser Leu 
195 200 205 



^^21 

• 



^210> 34 

1> 242 

<212> PRT 

<213> Paracoccus sp. MBIC1143 



<400> 34 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr ser Leu 
1 5 10 15 

lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala lie Ala 
35 40 . 45 



Seite 43 



336 



gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 384 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc gqc tgg cgc gag gqg ctg ctg ctg ccc 432 

Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctt gqg gat cgc tgg atg tac 

Val lie Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 

145 150 155 " 160 



480 



gtg gtc ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
val val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser lie Gin Leu Phe 
165 170 175 

g ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
I Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



624 



ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 672 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag gqg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



04sequ.txt 

Asn Phe Leu Gly Leu Thr Trp Leu ser Val Gly Leu Phe lie lie Ala 
50 55 60 

His Asp Ala Met His Gly ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

Arq Lys Met lie val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
K 115 120 125 



Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 ~ 140 



1 lie Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
45 150 155 160 

Val val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser lie Gin Leu Phe 
165 170 175 

val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

Asp Arg His Asn Ala Arg ser ser Arg lie Ser Asp Pro val Ser Leu 
195 200 205 

Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



ro Thr Val Pro Trp Trp Arg Leu Pro ser Thr Arg Thr Lys Gly Asp 



230 235 240 

Thr Ala 



<210> 35 

<211> 735 

<212> DNA 

<213> Brevundimonas aurantiaca 

<220> 

<221> CDS 

<222> (1)..(735) 

Seite 44 



04sequ.txt 

<223> 



<400> 35 

atg acc gcc gcc gtc gcc gag cca cgc acc gtc ccg cgc cag acc tgg 48 

Met Thr Ala Ala Val Ala Glu Pro Arg Thr val Pro Arg Gin Thr Trp 
1 5 10 15 



ate ggt ctg acc ctg gcg gga atg ate gtg gcg gga tgg gcg gtt ctg 
lie Gly Leu Thr Leu Ala Gly Met lie VaT Ala Gly Trp Ala val Leu 
20 25 30 

cat gtc tac ggc gtc tat ttt cac cga tgg ggg ccg ttg acc ctg gtg 
His Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu val 
35 40 45 




ggg gcg egg ccg gcc aat etc ctg acc ttc tgg gcc gcg ccg gcc 
Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala 
165 170 175 



96 



144 



288 



336 



ate gcc ccg gcg ate gtg gcg gtc cag acc tgg ttg teg gtc ggc ctt 192 
lie Ala Pro Ala lie Val Ala Val Gin Thr Trp Leu Ser val Gly Leu 
50 55 60 

ttc ate gtc gcc cat gac gcc atg tac ggc tec ctg gcg ccg gga egg 240 
" e lie val Ala His Asp Ala Met Tyr Gly ser Leu Ala Pro Gly Arg 

70 75 80 

ccg egg ctg aac gcc gca gtc ggc egg ctg acc ctg ggg etc tat gcg 
Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala 
85 90 95 

ggc ttc cgc ttc gat egg ctg aag acg gcg cac cac gcc cac cac gcc 
Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala 
100 105 110 

gcg ccc ggc acg gcc gac gac ccg gat ttt cac gcc ccg gcg ccc cgc 384 
Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg 
115 120 125 

gcc ttc ctt ccc tgg ttc ctg aac ttc ttt cgc acc tat ttc ggc tgg 432 
Ala Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp 
130 135 140 

cgc gag atg gcg gtc ctg acc gcc ctg gtc ctg ate gcc etc ttc ggc 480 
Arg Glu Met Ala val Leu Thr Ala Leu val Leu lie Ala Leu Phe Gly 
145 150 155 160 



528 



ctg ctt tea gcg ctt cag etc ttc acc ttc ggc acc tgg ctg ccg cac 576 
Leu Leu ser Ala Leu Gin Leu Phe Thr Phe Gly Thr Trp Leu Pro His 
180 185 190 

cgc cac acc gac cag ccg ttc gcc gac gcg cac cac gcc cgc age age 624 
Arg His Thr Asp Gin Pro Phe Ala Asp Ala His His Ala Arg Ser ser 
195 200 205 

ggc tac ggc ccc gtg ctt tec ctg etc acc tgt ttc cac ttc ggc cgc 672 
Gly Tyr Gly Pro val Leu Ser Leu Leu Thr Cys Phe His Phe Gly Arg 
210 215 220 

cac cac gaa cac cat ctg age ccc tgg egg ccc tgg tgg cgt ctg tgg 720 
His His Glu His His Leu Ser Pro Trp Arg Pro Trp Trp Arg Leu Trp 
225 230 235 240 

cgc ggc gag tct tga 735 
Arg Gly Glu ser 

Seite 45 




04sequ.txt 

<210> 36 
<211> 244 
<212> PRT 

<213> Brevundimonas aurantiaca 
<400> 36 

Met Thr Ala Ala Val Ala Glu Pro Arg Thr val Pro Arg Gin Thr Trp 
15 10 ^ 15 

lie Gly Leu Thr Leu Ala Gly Met lie Val Ala Gly Trp Ala Val Leu 
20 25 30 

is Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu Val 
35 40 45 

lie Ala Pro Ala lie Val Ala Val Gin Thr Trp Leu Ser Val Gly Leu 
50 55 60 

Phe lie val Ala His Asp Ala Met Tyr Gly Ser Leu Ala Pro Gly Arg 
65 70 75 80 

Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala 
85 90 95 

Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala 
100 105 110 

Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg 
115 120 125 



Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp 
130 135 140 



Arg Glu Met Ala val Leu Thr Ala Leu val Leu lie Ala Leu Phe Gly 
145 150 155 160 

Leu Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala 
165 170 175 

Leu Leu Ser Ala Leu Gin Leu Phe Thr Phe Gly Thr Trp Leu Pro His 
180 185 190 

Arg His Thr Asp Gin Pro Phe Ala Asp Ala His His Ala Arg Ser Ser 
195 200 205 

Gly Tyr Gly Pro Val Leu ser Leu Leu Thr Cys Phe His Phe Gly Arg 
210 215 220 

Seite 46 



04sequ.txt 




Arg Gly Glu Ser 



<210> 37 

<211> 690 

<212> DNA 

<213> Nodularia spumigena NSORlO 

<220> 

21> CDS 
22> CD ■ • (690) 
<223> 




• 



atg gcg ate gcc att att agt ata tgg get ate age eta ggt ttg tta 
Met Ala He Ala He He Ser He Trp Ala He ser Leu cTy Leu Leu 
1 5 10 15 

ctt tat att gat ata tec caa ttc aag ttt tgg atg ttg tta ccg etc 
Leu Tyr He Asp He Ser Gin Phe Lys Phe Trp Met Leu Leu Pro Leu 
20 25 30 

ata ttt tgg caa aca ttt tta tat acg gga tta ttt att aca get cat 
He Phe Trp Gin Thr Phe Leu Tyr Thr cTy Leu Phe lie Thr Ala His 
35 40 45 

aat ace ata cat ggg gta gtt ttt ccc aaa aat ccc aaa ate aac cat 

t 9 sp Ala Met His Gly Val val Phe Pro Lys Asn Pro Lys He Asn His 
k 50 55 60 

Ic att ggc tea ttg tgc ctg ttt ctt tat ggt ctt tta cct tat caa 
Phe He Gly ser Leu cys Leu Phe Leu Tyr G?y Leu Leu Pro Tyr Gin 
65 70 75 80 

aaa ctt tta aaa aag cat tgg eta cat cac cat aat cca gcc agt gaa 
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala ser Glu 
* 85 90 95 

aca gat cca gat ttt cac aac ggg aag cag aaa aac ttt ttt get tgg 
Thr Asp Pro Asp Phe His Asn Gly Lys Gin Lys Asn Phe Phe Ala Trp.. 
100 105 HO 

tat tta tat ttt atg aag cgt tac tgg agt tgg tta caa att ate aca 
Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gin He He Thr 
115 120 125 

tta atg att att tat aac tta eta aaa tat ata tgg cat ttt cca gag 
Leu Met He He Tyr Asn Leu Leu Lys Tyr He Trp His Phe Pro Glu 
130 135 140 

gat aat atg act tat ttt tgg gta gtt ccc tea att tta agt tct tta 

Seite 47 



96 
144 



240 

288 

336 

384 

432 

480 




04sequ.txt 

Asp Asn Met Thr Tyr Phe Trp Val val Pro ser lie Leu ser ser Leu 
145 150 155 160 

caa tta ttt tat ttt gga act ttt eta ccc cac agt gag cct gta gaa 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His ser Glu Pro Val Glu 
165 170 175 

ggt tat aaa gag cct cat cgt tec caa act att age cgt ccc att tgg 
Gly Tyr Lys Glu Pro His Arg Ser Gin Thr lie Ser Arg Pro lie Trp 
180 ~ 185 190 

tgg tea ttt ata act tgt tac cat ttt ggt tat cat tac gaa cat cat 
Trp Ser Phe lie Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His 
195 200 205 

gaa tac ccc cat gtt cct tgg tgg caa tta cca gaa att tat aaa atg 
Glu Tyr Pro His val Pro Trp Trp Gin Leu Pro Glu lie Tyr Lys Met 
210 215 220 

tct aaa tea aat ttg tga 
Ser Lys Ser Asn Leu 
225 



Bio> 


38 


<211> 


229 


<212> 


PRT 


<213> 


Nodularia 


<400> 


38 



Met Ala lie Ala lie lie Ser lie Trp Ala lie Ser Leu Gly Leu Leu 

15 10 15 

Leu Tyr lie Asp lie ser Gin Phe Lys Phe Trp Met Leu Leu Pro Leu 
20 25 30 



le Phe Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ala His 
^ 35 40 45 



Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys lie Asn His 
50 55 60 

Phe lie Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gin 
65 70 75 80 

Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu 
85 90 95 

Thr Asp Pro Asp Phe His Asn Gly Lys Gin Lys Asn Phe Phe Ala Trp 
100 105 110 

Tyr Leu Tyr Phe Met Lys Arg Tyr Trp ser Trp Leu Gin lie lie Thr 
115 120 125 



Seite 48 



04sequ.txt 

Leu Met lie lie Tyr Asn Leu Leu Lys Tyr lie Trp His Phe Pro Glu 
130 135 140 

Asp Asn Met Thr Tyr Phe Trp val Val Pro ser lie Leu Ser ser Leu 
145 150 155 160 

Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu 
165 ' 170 175 

Glv Tyr Lys Glu Pro His Arg Ser Gin Thr lie Ser Arg Pro lie Trp 
y y 180 185 190 

Trp ser Phe lie Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His 
195 200 205 



Glu Tyr Pro His Val Pro Trp Trp Gin Leu Pro Glu lie Tyr Lys Met 
210 215 220 



r Lys ser Asn Leu 
25 



<210> 39 

<211> 789 

<212> DNA 

<213> Nostoc puncti forme ATCC 29133 



<220> 

<221> CDS 

<222> (1) . . (789) 



i£223> 




<400> 39 



ttg 
Leu 
1 


aat 
Asn 


ttt tgt 
Phe Cys 


gat 
Asp 
5 


aaa 
Lys 


cca 
Pro 


gtt 
val 


age 
ser 


tat tat 
Tyr Tyr 
10 


gtt 
val 


gca 
Ala 


ata 
lie 


gag 
Glu 
15 


caa 
Gin 


tta 
Leu 


agt 
Ser 


get 
Ala 


aaa 
Lys 
20 


gaa 
Glu 


gat 
Asp 


act 
Thr 


gtt 
Val 


tgg 
Trp 

25 


ggg 

Gly 


ctg 
Leu 


gtg 
val 


att 
lie 


gtc 
Val 
30 


ata 
lie 


gta 
val 


att 
He 


att 
He 


agt 
ser 
35 


ctt 
Leu 


tgg 
Trp 


gta 
val 


get 
Ala 


agt 
ser 
40 


ttg 
Leu 


get ttt 
Ala Phe 


tta 
Leu 


eta 
Leu 
45 


get 
Ala 


att 
He 


aat 
Asn 


tat 
Tyr 


gee 
Ala 
50 


aaa 
Lys 


gtc 
val 


cca 
Pro 


att 
He 


tgg 
Trp 
55 


ttg 
Leu 


ata 
He 


cct 
Pro 


att 
lie 


gca 
Ala 
60 


ata 
lie 


gtt 
val 


tgg 
Trp 


caa 
Gin 


atg 
Met 
65 


ttc 
Phe 


ctt tat 
Leu Tyr 


aca 
Thr 


ggg 

Gly 
70 


eta 
Leu 


ttt 
Phe 


att 
lie 


act 
Thr 


gca 
Ala 
75 


cat 
His 


gat 
Asp 


get 
Ala 


atg 
Met 


cat 
His 
80 



seite 49 
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ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ate gqt tea 
Gly Ser val Tyr Arg Lys Asn Pro Lys lie Asn Asn Phe lie Gly ser 
85 90 95 

eta get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 
Leu Ala VaT Ala Leu Tyr Ala vaT Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 

aat cat tgc tta cat cat cgt cat cct get age gaa gtt gac cca gat 
Asn His cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 

ttt cat gat ggt aag aga aca aac get att ttc tgg tat etc cat ttc 
Phe His Asp Gly Lys Arg Thr Asn Ala lie Phe Trp Tyr Leu His Phe 
130 135 140 

atg ata gaa tac tec agt tgg caa cag tta ata gta eta act ate eta 
Met lie Glu Tyr ser ser Trp Gin Gin Leu lie val Leu Thr lie Leu 
145 150 155 160 



^^t 



ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 
' e Asn Leu Ala Lys Tyr Val Leu His lie His Gin lie Asn Leu lie 
165 170 175 



ta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 
Leu Phe Trp Ser lie Pro Pro lie Leu Ser ser lie Gin Leu Phe Tyr 
180 185 190 

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 

ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 
Pro His Cys Ser Gin Thr lie Lys Leu Pro Thr Phe Leu ser Phe lie 
210 215 220 

get tgc tac cac ttt gqt tat cat gaa gaa cat cat gag tat ccc cat 
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 
val Pro trp Trp Gin Leu Pro Ser val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 



k t tea gta ace aat teg taa 
Ser Val Thr Asn Ser 
260 



<210> 40 

<211> 262 

<212> PRT 

<213> Nostoc puncti forme ATCC 29133 

<400> 40 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala lie Glu Gin 
1 5 10 15 

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu val lie val lie val 
20 25 30 
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lie lie ser Leu Trp Val Ala ser Leu Ala Phe Leu Leu Ala lie Asn 
35 40 45 

Tvr Ala Lys Val Pro lie Trp Leu lie Pro lie Ala lie Val Trp Gin 
50 55 60 

Met Phe Leu Tyr Thr Gly Leu Phe lie Thr Ala His Asp Ala Met His 
65 70 75 80 

Gly Ser Val Tyr Arg Lys Asn Pro Lys lie Asn Asn Phe lie Gly ser 
85 90 95 

Leu Ala val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 




sn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 



Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 



Met lie Glu Tyr Ser ser Trp Gin Gin Leu lie Val Leu Thr lie Leu 
145 150 155 160 

Phe Asn Leu Ala Lys Tyr val Leu His lie His Gin lie Asn Leu lie 
165 170 175 

Leu Phe Trp Ser lie Pro Pro lie Leu Ser Ser lie Gin Leu Phe Tyr 
180 185 190 

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr val Tyr 
195 200 205 




io His cys Ser Gin Thr lie Lys Leu Pro Thr Phe Leu Ser Phe lie 
1 210 215 220 



Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 



Asn Ser Val Thr Asn ser 
260 



<210> 41 
<211> 762 
<212> DNA 
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04sequ.txt 
<213> Nostoc puncti forme ATCC 29133 



<220> 

<221> CDS 

<222> (1) . . C762) 

<223> 



<400> 41 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 
vaT lie Gin Leu Glu Gin Pro Leu ser His Gin Ala Lys Leu Thr Pro 
1 5 10 15 

gta ctg aga agt aaa tct cag ttt aag gqg ctt ttc att get att gtc 
Val Leu Arg Ser Lys Ser Gin Phe Lys Giy Leu Phe lie Ala lie Val 
20 25 30 



# 



tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc tat 
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser ser Leu Gin Leu Phe Tyr 
180 185 190 

ttt ggt act ttt tta ccc cat agt gaa cca ata gqg ggt tat gtt cag 
Phe Gly Thr Phe Leu Pro His ser Glu Pro lie Gly Gly Tyr val Gin 
195 200 205 



48 



96 



t gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 144 
e Val Ser Ala Trp Val lie Ser Leu Ser Leu Leu Leu ser Leu Asp 
35 40 45 



ate tea aag eta aaa ttt tgg atg tta ttg cct gtt ata eta tgg caa 192 
lie Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val lie Leu Trp Gin 
50 55 60 

aca ttt tta tat acg gqa tta ttt att aca tct cat gat gee atg cat 240 
Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ser His Asp Ala Met His 
65 70 75 80 

ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gqa aca 
Gly Val val Phe Pro Gin Asn Thr Lys lie Asn His Leu lie Gly Thr 
85 90 95 

ttg acc eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 336 
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 



288 



aaa cat tgg tta cac cac cac aat cca gca age tea ata gac ccg gat 384 
Lys His Trp Leu His His His Asn Pro Ala ser ser lie Asp Pro Asp 
115 120 125 



432 



480 



ftt cac aat ggt aaa cac caa agt ttc ttt get tgg tat ttt cat ttt 
he His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 

atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att 
Met Lys Gly Tyr Trp Ser Trp Gly Gin lie lie Ala Leu Thr lie lie 
145 150 155 160 

tat aac ttt get aaa tac ata etc cat ate cca agt gat aat eta act 528 
Tyr Asn Phe Ala Lys Tyr lie Leu His lie Pro Ser Asp Asn Leu Thr 
165 170 175 



576 



624 



cct cat tgt gee caa aca att age cgt cct att tgg tgg tea ttt ate 672 
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pro His cys Ala Gin Thr lie ser Arg Pro lie Trp Trp ser Phe lie 
210 215 220 

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720 
Thr cvs Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762 
lie ser Trp Trp Gin Leu Pro Glu lie Tyr Lys Ala Lys 
245 250 

<210> 42 
<211> 253 
<212> PRT 

<213> Nostoc puncti forme ATCC 29133 



400> 42 



1 lie Gin Leu Glu Gin Pro Leu ser His Gin Ala Lys Leu Thr Pro 
5 10 15 

val Leu Arg ser Lys ser Gin Phe Lys Gly Leu Phe lie Ala lie Val 
20 25 30 

lie Val ser Ala Trp Val lie ser Leu ser Leu Leu Leu ser Leu Asp 
35 40 45 

lie Ser Lys Leu Lys Phe Trp Met Leu Leu Pro val lie Leu Trp Gin 
50 55 60 

Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr ser His Asp Ala Met His 
65 70 75 80 



• 



Gly Val Val Phe Pro Gin Asn Thr Lys lie Asn His Leu lie Gly Thr 
85 90 95 



eu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 

Lys His Trp Leu His His His Asn Pro Ala ser Ser lie Asp Pro Asp 
115 120 125 

Phe His Asn Gly Lys His Gin ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 

Met Lys Gly Tyr Trp Ser Trp Gly Gin lie lie Ala Leu Thr lie lie 
145 150 155 160 

Tyr Asn Phe Ala Lys Tyr lie Leu His lie Pro Ser Asp Asn Leu Thr 
165 170 175 
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Tyr Phe Trp Val Leu Pro Ser Leu Leu ser Sen Leu Gin Leu Phe Tyr 
180 - L °- > 

Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 

Pro His cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 

Thr Cys Tyr His Phe Gly Tyr His Glu Glu Hi| His Glu Tyr Pro His 

He Ser Trp Trp Gin Leu Pro Glu lie Tyr Lys Ala Lys 
245 250 

<210> 43 
11> 1536 
12> DNA 

<213> Deinococcus radiodurans Rl 



<220> 

<221> CDS 

<222> CO . - (1536) 

<223> 



a2g°ccg 4 gat tac gac ctg ate gtc atg ggc gcg ggc cac aac gcg ctg 48 
Met Pro Asp Tyr Asp Leu He val Met Gly Ala Gly His Asn Ala Leu 
1 5 10 




act act qcc tac gec gec egg gcg ggc ctg aaa gtc ggc gtg ttc 
Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys Val cTy Vat Phe 
20 2 5 3U 

^ sb s?i as ss ss as a? m ?s s «? f as «a «a 

35 40 ^ 

ccc ggt tac cgc ttc gac tac ggc ggc age gee cac ate ctg att egg 
Pro Gly Tyr Arg Phe Asp Tyr Gly Gly Ser Ala His lie Leu lie Arg 
50 55 bU 

atg acg ccc ate gtg cgc gaa etc gaa etc acg egg cac ggg ctg cat 
Met Thr Pro He val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His 
65 70 '5 

tac etc gaa gtg gac cct atg ttt cac get tec gac ggt gaa acg ccc 
Tyr LeS Glu val Asp Pro Met Phe His Ala ser Asp cty Glu Thr Pro 
85 90 

88 SS Ife %i 1% BS SS 85 Sra ?£ 85- 3S 85 28 SS SS 

100 105 J -- LU 
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96 
144 
192 
240 
288 
336 



04sequ.txt 

aag ttt ccc ggg cag ggc gac gcc tac ggg cgc ttt etc gac gat tgg 
Lys Phe Pro Gly Gin Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp 
115 120 125 

aca ccc ttc gcg cgc gcc gtg gcc gac ctg ttc aac teg gcg ccg ggg 
Thr Pro Phe Ala Arg Ala val Ala- Asp Leu Phe Asn Ser Ala Pro Gly 
130 135 140 

ccq etc gac ctg ggc aaa atg gtg atg cgc age ggc cag ggc aag gac 
Pro Leu Asp Leu Gly Lys Met val Met Arg Ser Gly Gin Gly Lys Asp 
145 150 155 160 

tqq aac gag cag etc ccg cgc ate ctg egg ccc tac ggc gac gtg gcg 
Trp Asn Glu Gin Leu Pro Arg lie Leu Arg Pro Tyr Gly Asp Val Ala 
165 170 175 

cgc gag tac ttc age gag gag cgc gtg egg get ccc ctg ace tgg atg 
Arg Glu Tyr Phe Ser Glu Glu Arg val Arg Ala Pro Leu Thr Trp Met 
180 185 190 

gcg gcc cag age ggc ccc cca ccc teg gac ccg ctg age gcg ccc ttt 
Ala Ala Gin Ser Gly Pro Pro Pro ser Asp Pro Leu Ser Ala Pro Phe 
195 200 205 

tg ctg tgg cac ccg etc tac cac gaa ggc ggc gtg gcg egg ccc aaa 
Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys 
210 215 220 

ggc ggc age ggc ggc ctg ace aaa gcc ctg cgc egg gcc ace gag gcc 
Gly Gly Ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala Thr Glu Ala 
225 230 235 240 

qaa ggc ggc gag gtc ttc ace gac gcg ccg gtc aag gaa att ctg gtc 
Glu Gly Gly Glu val Phe Thr Asp Ala Pro Val Lys Glu He Leu val 
245 250 255 

aag gac ggc aag gcg cag ggc ate egg ctg gaa age ggc gag acg tac 
Lys Asp Gly Lys Ala Gin Gly lie Arg Leu Glu Ser Gly Glu Thr Tyr 
260 265 270 

ace gcc cgc gcc gtc gtg teg ggc gtc cac ate ctg acc act gcg aat 
Thr Ala Arg Ala val val ser Gly Val His lie Leu Thr Thr Ala Asn 
275 280 285 




m 



c ctg 
Leu 
290 



ccc gcc gaa tat gtc cct age gcc gcc agg aat gtg cgc gtg 
Pro Ala Glu Tyr val Pro Ser Ala Ala Arg Asn Val Arg val 
295 300 



qqc aac ggc ttc ggc atg att ttg cgc etc gcc etc agt gaa aaa gtc 
Gly Asn Gly Phe Gly Met lie Leu Arg Leu Ala Leu ser Glu Lys yal 
305 310 315 320 

aaa tac cgt cac cac acc gag ccc gac tea cgc ate ggc ctg gga ttg 
Lys Tyr Arg His His Thr Glu Pro Asp Ser Arg lie Gly Leu Gly Leu 
325 330 335 

ctg ate aaa aac gag egg caa ate atg cag ggc tac ggc gaa tac etc 
Leu lie Lys Asn Glu Arg Gin lie Met Gin Gly Tyr Gly Glu Tyr Leu 
340 ~ 345 350 

gcc ggg cag ccc acc acc gac ccg ccc etc gtc gcc atg age ttc age 
Ala Gly Gin Pro Thr Thr Asp Pro Pro Leu val Ala Met Ser Phe ser 
355 360 365 

gcg gtg gac gac teg etc gcc cca ccg aac ggc gac gtg ttg tgg ctg 
Ala Val Asp Asp ser Leu Ala Pro Pro Asn Gly Asp val Leu Trp Leu 
370 375 380 
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384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



04sequ.txt 

tgg gcg cag tac tac ccc ttc gag etc gec acc ggg age tgg gaa acg 1200 
Trp Ala Gin Tyr Tyr Pro Phe Glu Leu Ala Thr Gly ser Trp Glu Thr 
385 390 395 400 

cgc acc gec gaa gcg egg gag aac ate ctg egg gec ttt gag cac tac 1248 
Arg Thr Ala Glu Ala Arg Glu Asn lie Leu Arg Ala Phe Glu His Tyr 
405 ~ 410 ~ 415 

gcg ccg gqc acc cgc gac acg att gtq gqc gaa etc gtq cag acg ccg 1296 
Ala Pro Gly Thr Arg Asp Thr lie val Gly Glu Leu val Gin Thr Pro 
420 " 425 430 



cag tgg ctg gaa acc aac etc gqc ctg cac egg gqc aac gtq atg cac 
Gin Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His 
435 440 445 



gcg age cag tac cgc tgg ccg gqc gtg cag ggg ctg tac etc acc gqc 
Ala ser Gin Tyr Arg Trp Pro Gly val Gin Gly Leu Tyr Leu Thr Gly 
5 470 475 480 



tjcc age acc cac ccc gqc gga gqc ate atg gqc gee teg gga cgc aac 
Ala Ser Thr His Pro Gly Gly Gly lie Met Gly Ala Ser Gly Arg Asn 
485 ^ 490 495 



Pro Asp Tyr Asp Leu lie val Met Gly Ala Gly His Asn Ala Leu 
5 10 15 



Val Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys val Gly val Phe 
20 25 30 

Glu Arg Arg His Leu val Gly Gly Ala val ser Thr Glu Glu Val Val 
35 40 45 

Pro Gly Tyr Arg Phe Asp Tyr Gly Gly ser Ala His lie Leu lie Arg 
50 55 60 

Met Thr Pro lie Val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His 
65 70 75 80 

Tyr Leu Glu Val Asp Pro Met Phe His Ala Ser Asp Gly Glu Thr Pro 
85 90 95 

Seite 56 



1344 



ctg gaa atg tec ttc gac cag atg ttc tec ttc cgc ccc tgg ctg aaa 1392 
Leu Glu Met Ser Phe Asp Gin Met Phe Ser Phe Arg Pro Trp Leu Lys 
450 455 460 



1440 



1488 



gcg gcg egg gtc ate gtq aag gac ctg acg egg agg cgc tgg aaa tga 1536 
Ala Ala Arg Val lie Val Lys Asp Leu Thr Arg Arg Arg Trp Lys 
500 505 510 

<210> 44 
<211> 511 
<212> PRT 

<213> Deinococcus radiodurans Rl 



<400> 44 




04sequ.txt 

Trp Phe lie His Arg Asp Ala Gly Arg Thr lie Arg Glu Leu Asp Glu 
100 " 105 110 

Lys Phe Pro Gly Gin Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp 
115 120 125 

Thr Pro Phe Ala Arg Ala val Ala Asp Leu Phe Asn Ser Ala Pro Gly 
130 ~ 135 140 

Pro Leu Asp Leu Gly Lys Met Val Met Arg Ser Gly Gin Gly Lys Asp 
145 150 155 160 

Trp Asn Glu Gin Leu Pro Arg lie Leu Arg Pro Tyr Gly Asp val Ala 
165 170 175 



rq Glu Tyr Phe ser Glu Glu Arg Val Arg Ala Pro Leu Thr Trp Met 
180 185 190 



Ala Ala Gin ser Gly Pro Pro Pro Ser Asp Pro Leu Ser Ala Pro Phe 
195 200 205 

Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys 
210 215 220 

Gly Gly ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala Thr Glu Ala 
225 230 235 240 

Glu Gly Gly Glu Val Phe Thr Asp Ala Pro val Lys Glu lie Leu Val 
245 250 255 



Lys Asp Gly Lys Ala Gin Gly lie Arg Leu Glu ser Gly Glu Thr Tyr 
260 265 270 



Ala Arg Ala Val Val Ser Gly val His lie Leu Thr Thr Ala Asn 
275 280 285 



Ala Leu Pro Ala Glu Tyr val Pro ser Ala Ala Arg Asn val Arg Val 

"0 



290 



295 



30" 



Gly Asn Gly Phe Gly Met lie Leu Arg Leu Ala Leu Ser Glu Lys val 
305 310 315 320 

Lys Tyr Arg His His Thr Glu Pro Asp ser Arg lie Gly Leu Gly Leu 
325 330 335 

Leu lie Lys Asn Glu Arg Gin lie Met Gin Gly Tyr Gly Glu Tyr Leu 
340 ~ 345 350 



Ala Gly Gin Pro Thr Thr Asp Pro Pro Leu val Ala Met ser Phe ser 
355 360 365 
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Ala val Asp Asp Ser Leu Ala Pro Pro Asn Gly Asp val Leu Trp Leu 
370 375 380 

Trp Ala Gin Tyr Tyr Pro Phe Glu Leu Ala Thr Gly Ser Trp Glu Thr 
385 390 395 400 

Arg Thr Ala Glu Ala Arg Glu Asn lie Leu Arg Ala Phe Glu His Tyr 
405 ~ 410 " 415 

Ala Pro Gly Thr Arg Asp Thr lie Val Gly Glu Leu Val Gin Thr Pro 
420 ^ 425 430 

Gin Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His 
435 440 ~ 445 

eu Glu Met Ser Phe Asp Gin Met Phe Ser Phe Arg Pro Trp Leu Lys 
* 450 455 460 

Ala Ser Gin Tyr Arg Trp Pro Gly val Gin Gly Leu Tyr Leu Thr Gly 
465 470 475 480 

Ala ser Thr His Pro Gly Gly Gly lie Met Gly Ala Ser Gly Arg Asn 
485 490 495 

Ala Ala Arg val lie val Lys Asp Leu Thr Arg Arg Arg Trp Lys 
500 505 "* 510 

<210> 45 
<211> 1650 
<212> DNA 

<213> Lycopersicon esculentum 



^220> 
<221> CDS 
<222> (112) . . (1614) 
<223> 



<400> 45 

ggcacgagga aacttttctc tcttcactag ctgtttacat gcttgaaatt tcaagatttt 60 

aggaccccat ttgaagtttt cttgaaacaa atattaccct gttggaaaaa g atg gat 117 

Met Asp 
1 

act ttg ttg aaa acc cca aat aac ctt gaa ttt ctg aac cca cat cat 165 
Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro His His 
5 10 15 
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ggt ttt get gtt aaa get agt acc ttt aga tct gag aag cat cat aat 
Gly Phe Ala Val Lys Ala ser Thr Phe Arg ser Glu Lys His His Asn 
20 25 30 



gtt gtg gat ctt get gtg gtt ggt ggt ggc cct gca gga ctt get gtt 
val Val Asp Leu Ala Val Val Gly Gly Gly Pro Ala Gly Leu Ala val 
85 90 95 




• 



att cag gca acg gtg gtg etc gat gca act ggc ttc tct aga tct ctt 
lie Gin Ala Thr val val Leu Asp Ala Thr Gly Phe Ser Arg ser Leu 
215 220 225 



att ttg get gaa gtg gaa gag cac ccc ttt gat gta aac aag atg gtt 
lie Leu Ala Glu val Glu Glu His Pro Phe Asp Val Asn Lys Met Val 
245 250 255 



213 



ttt ggt tct agg aag ttt tgt gaa act ttg ggt aga agt gtt tgt gtt 261 
Phe Gly ser Arg Lys Phe Cys Glu Thr Leu Gly Arg ser val Cys val 
35 40 45 50 

aag ggt agt agt agt get ctt tta gag ctt gta cct gag acc aaa aag 309 
Lys Gly ser Ser Ser Ala Leu Leu Glu Leu val Pro Glu Thr Lys Lys 
55 60 65 

gag aat ctt gat ttt gag ctt cct atg tat gac cct tea aaa ggg gtt 357 
Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro Ser Lys Gly val 
70 75 80 



405 



gca cag caa gtt tct gaa gca gga etc tct gtt tgt tea att gat ccg 453 
la Gin Gin val ser Glu Ala Gly Leu ser Val cys ser lie Asp Pro 
100 105 110 

at cct aaa ttg ata tgg cct aat aac tat ggt gtt tgg gtg gat gaa 501 
Asn Pro Lys Leu lie Trp Pro Asn Asn Tyr Gly val Trp val Asp Glu 
115 120 125 130 

ttt gag get atg gac ttg tta gat tgt eta gat get acc tgg tct ggt 549 
Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp ser Gly 
135 140 145 

gca gca gtg tac att gat gat aat acg get aaa gat ctt cat aga cct 597 
Ala Ala val Tyr lie Asp Asp Asn Thr Ala Lys Asp Leu His Arg Pro 
150 155 160 

tat gga agg gtt aac egg aaa cag ctg aaa teg aaa atg atg cag aaa 645 
Tyr Gly Arg Val Asn Arg Lys Gin Leu Lys Ser Lys Met Met Gin Lys 
165 170 175 

tgt ata atg aat ggt gtt aaa ttc cac caa gec aaa gtt ata aag gtg 693 
Cys lie Met Asn Gly val Lys Phe His Gin Ala Lys Val lie Lys Val 
180 185 190 



t cat gag gaa teg aaa tec atg ttg ata tgc aat gat ggt att act 741 
|e His Glu Glu Ser Lys Ser Met Leu lie Cys Asn Asp Gly lie Thr 
3 200 205 210 



789 



gtt cag tat gat aag cct tat aac ccc ggg tat caa gtt get tat ggc 837 
Val Gin Tyr Asp Lys Pro Tyr Asn Pro Gly Tyr Gin Val Ala Tyr Gly 
230 235 240 



885 



ttc atg gat tgg cga gat tct cat ttg aag aac aat act gat etc aag 933 
Phe Met Asp Trp Arg Asp ser His Leu Lys Asn Asn Thr Asp Leu Lys 
260 265 270 

gag aga aat agt aga ata cca act ttt ctt tat gca atg cca ttt tea 981 

Glu Arg Asn Ser Arg lie Pro Thr Phe Leu Tyr Ala Met Pro Phe Ser 
275 280 285 290 
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tec aac agg ata ttt ctt gaa gaa aca tea etc gta get cgt cct ggc 1029 

Ser Asn Arg lie Phe Leu Glu Glu Thr Ser Leu Val Ala Arg Pro Gly 

295 300 305 

ttg cgt ata gat gat att caa gaa cga atg gtq get cgt tta aac cat 1077 
Leu Arg lie Asp Asp lie Gin Glu Arg Met val Ala Arg- Leu Asn His 
310 315 320 



ttg ggg ata aaa gtq aag age att gaa gaa gat gaa cat tgt eta ata 
Leu Gly lie Lys val Lys ser lie Glu Glu Asp Glu His cys Leu lie 



325 



330 



335 



atg gat gqt cca ctt cca gta tta cct cag aga gtc gtt gqa ate 
Met Gly Gly Pro Leu Pro Val Leu Pro Gin Arg val val Gly lie 



cca 

Pro Met Gly Gly Pro Leu Pro Val Leu Pro Gin Arg val val Gly 
340 345 350 



gqt gqt aca get ggc atg gtt cat cca tec ace gqt tat atg gtq gca 
Gly Gly Thr Ala Gly Met val His Pro Ser Thr Gly Tyr Met val Ala 



3& 



360 



365 



370 




agg aca eta get gcg get cct gtt gtt gee aat gee ata att caa tac 
rg Thr Leu Ala Ala Ala Pro Val val Ala Asn Ala lie lie Gin Tyr 
375 380 385 

etc ggt tct gaa aga agt cat teg ggt aat gaa tta tec aca get gtt 
Leu Gly ser Glu Arg Ser His Ser Gly Asn Glu Leu Ser Thr Ala Val 



390 



395 



400 



tgg aaa gat ttg tgg cct ata gag agg aga cgt caa aga gag ttc ttc 
Trp Lys Asp Leu Trp Pro lie Glu Arg Arg Arg Gin Arg Glu Phe Phe 
405 410 " 415 

tgc ttc gqt atg gat att ctt ctg aag ctt gat tta cct get aca aga 
Cys Phe Gly Met Asp lie Leu Leu Lys Leu Asp Leu Pro Ala Thr Arg 
420 425 430 

agg ttc ttt gat gca ttc ttt gac tta gaa cct cgt tat tgg cat ggc 
Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp His Gly 
435 440 445 ~ 450 

ttc tta teg tct cga ttg ttt eta cct gaa etc ata gtt ttt ggg ctg 
Phe Leu ser ser Arg Leu Phe Leu Pro Glu Leu lie val Phe Gly Leu 
455 460 465 

k t eta ttc tct cat get tea aat act tct aga ttt gag ata atg aca 
Leu Phe ser His Ala Ser Asn Thr Ser Arg Phe Glu lie Met Thr 
470 475 ~ 480 

aag gqa act gtt cca tta gta aat atg ate aac aat ttg tta cag gat 
Lys Gly Thr val Pro Leu val Asn Met lie Asn Asn Leu Leu Gin Asp 
485 490 495 

aaa gaa tga atccgagtaa tteggaatet tgtccaatct cgtgcc 
Lys Glu 
500 




1125 



1173 



1221 



1269 



1317 



1365 



1413 



1461 



1509 



1557 



1605 



1650 



<210> 46 

<211> 500 

<212> PRT 

<213> Lycopersicon esculentum 



Seite 60 



<400> 46 



04sequ.txt 




Met Asp Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro 
1 5 10 15 

His His Gly Phe Ala Val • Lys Ala ser Thr Phe Arg Ser Glu Lys His 
20 25 30 

His Asn Phe Gly Ser Arg Lys Phe cys Glu Thr Leu Gly Arg ser Val 
35 40 45 

Cys val Lys Gly Ser ser Ser Ala Leu Leu Glu Leu val Pro Glu Thr 
50 55 60 

lvs Lys Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro ser Lys 
65 70 75 80 



ly val val val Asp Leu Ala val Val Gly Gly Gly Pro Ala Gly Leu 
85 90 95 



Ala Val Ala Gin Gin val ser Glu Ala Gly Leu Ser val Cys Ser lie 
100 105 110 

Asp Pro Asn Pro Lys Leu lie Trp Pro Asn Asn Tyr Gly Val Trp val 
115 120 125 

Asp Glu Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp 
130 135 140 

ser Gly Ala Ala Val Tyr He Asp Asp Asn Thr Ala Lys Asp Leu His 
145 150 155 160 




Arg Pro Tyr Gly Arg val Asn Arg Lys Gin Leu Lys ser Lys Met Met 
165 170 175 



In Lys Cys lie Met Asn Gly Val Lys Phe His Gin Ala Lys val lie 
180 185 190 



Lys val lie His Glu Glu ser Lys ser Met Leu lie Cys Asn Asp Gly 
195 200 205 

He Thr He Gin Ala Thr val val Leu Asp Ala Thr Gly Phe Ser Arg 
210 215 220 

ser Leu val Gin Tyr Asp Lys Pro Tyr Asn Pro Gly Tyr Gin val Ala 
225 230 235 240 

Tyr Gly lie Leu Ala Glu Val Glu Glu His Pro Phe Asp val Asn Lys 
245 250 255 



Met val Phe Met Asp Trp Arg Asp Ser His Leu Lys Asn Asn Thr Asp 
260 265 270 
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Leu Lys Glu Arg Asn Ser Arg lie Pro Thr Phe Leu Tyr Ala Met Pro 
275 280 285 

Phe Ser Ser Asn Arg lie Phe Leu Glu Glu Thr ser Leu val Ala Arg 
290 295 300 

pro Gly Leu Arg lie Asp Asp lie Gin Glu Arg Met val Ala Arg Leu 
305 310 315 320 

Asn His Leu Gly He Lys Val Lys Ser lie Glu Glu Asp Glu His Cys 
325 330 335 

Leu lie Pro Met Gly Gly Pro Leu Pro val Leu Pro Gin Arg val Val 
340 345 350 




1y lie Gly Gly Thr Ala Gly Met val His Pro Ser Thr Gly Tyr Met 
355 360 365 



Val Ala Arg Thr Leu Ala Ala Ala Pro val Val Ala Asn Ala lie He 
370 375 380 



Gin Tyr Leu Gly Ser Glu Arg ser His ser Gly Asn Glu Leu Ser Thr 
385 390 395 400 

Ala Val Trp Lys Asp Leu Trp Pro lie Glu Arg Arg Arg Gin Arg Glu 
405 410 415 

Phe Phe cys Phe Gly Met Asp lie Leu Leu Lys Leu Asp Leu Pro Ala 
420 425 430 



Thr Arg Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp 
435 440 445 



Gly Phe Leu Ser Ser Arg Leu Phe Leu Pro Glu Leu lie val Phe 
450 455 460 



Gly Leu Ser Leu Phe Ser His Ala Ser Asn Thr ser Arg Phe Glu lie 
465 470 475 480 

Met Thr Lys Gly Thr Val Pro Leu Val Asn Met lie Asn Asn Leu Leu 

485 490 495 



Gin Asp Lys Glu 
500 



<210> 47 
<211> 1666 
<212> DNA 



Seite 62 
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<213> Lycopersicon esculentum 



<220> 

<221> CDS 

<222> CD - ■ (1494) 

<223> 



<400> 47 

atg gaa get ctt etc aag cct ttt cca tct ctt tta ctt tec tct cct 48 

Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu Ser ser Pro 
1 5 10 15 

aca ccc cat agg tct att ttc caa caa aat ccc tct ttt eta agt ccc 96 
Thr Pro His Arg Ser lie Phe Gin Gin Asn Pro ser Phe Leu Ser Pro 
20 25 30 



c ace aaa aaa aaa tea aga aaa tgt ctt ctt aga aac aaa agt agt 144 
r Thr Lys Lys Lys ser Arg Lys cys Leu Leu Arg Asn Lys Ser Ser 
35 40 45 

aaa ctt ttt tgt age ttt ctt gat tta gca ccc aca tea aag cca gag 192 
Lys Leu Phe cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu 
50 55 60 

tct tta gat gtt aac ate tea tgg gtt gat cct aat teg aat egg get 240 
ser Leu Asp Val Asn lie Ser Trp Val Asp Pro Asn Ser Asn Arg Ala 
65 70 75 80 

caa ttc gac gtg ate att ate gga get ggc cct get ggg etc agg eta 288 
Gin Phe Asp val lie lie lie Gly Ala Gly Pro Ala Gly Leu Arg Leu 
85 90 95 

get gaa caa gtt tct aaa tat ggt att aag gta tgt tgt gtt gac cct 336 
Ala Glu Gin Val Ser Lys Tyr Gly lie Lys val Cys Cys Val Asp Pro 
100 105 110 



^^Sei 
®^?h! 



tea cca etc tec atg tgg cca aat aat tat ggt gtt tgg gtt gat gag 
Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu 
115 120 125 



384 



"t gag aat tta gga ctg gaa aat tgt tta gat cat aaa tgg cct atg 432 
he Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met 
130 135 140 



480 



act tgt gtg cat ata aat gat aac aaa act aag tat ttg gga aga cca 
Thr Cys val His lie Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro 
145 150 155 160 

tat ggt aga gtt agt aga aag aag ctg aag ttg aaa ttg ttg aat agt 528 
Tyr Gly Arg val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn ser 
165 170 175 

tgt gtt gag aac aga gtg aag ttt tat aaa get aag gtt tgg aaa gtg 576 
Cys val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys Val 
180 185 190 

gaa cat gaa gaa ttt gag tct tea att gtt tgt gat gat ggt aag aag 
Glu His Glu Glu Phe Glu Ser Ser lie val Cys Asp Asp Gly Lys Lys 
195 200 205 

ata aga ggt agt ttg gtt gtg gat gca agt ggt ttt get agt gat ttt 672 

Seite 63 



624 



04sequ.txt 

lie Arg Gly Ser Leu Val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe 
210 215 220 

ata gag tat gac agg cca aga aac cat gqt tat caa att get cat gqg 720 

lie Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gin lie Ala His Gly 

225 230 235 240 

gtt tta gta gaa gtt gat aat cat cca ttt gat ttg gat aaa atg gtg 

val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met val 

245 250 255 



gtg aat aat get aaa gaa cca aca ttc ttg tat gca atg cca ttt gat 
val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp 
275 280 285 

aga gat ttg gtt ttc ttg gaa gag act tct ttg gtg agt cgt cct gtt 
Arg Asp Leu val Phe Leu Glu Glu Thr ser Leu val ser Arg Pro val 
290 295 300 




ttg gqg ate aaa gtg aaa agt gtt att gag gaa gag aaa tgt gtg ate 
Leu Gly lie Lys Val Lys ser Val lie Glu Glu Glu Lys cys val lie 
325 330 335 



fq aat gqt ttg tgg cct ttg gat aga aga tgt gtt aga gaa tgt tat 
rp Asn Gly Leu Trp Pro Leu Asp Arg Arg cys Val Arg Glu Cys Tyr 
405 410 415 

tea ttt gqg atg gag aca ttg ttg aag ctt gat ttg aaa gqg act agg 
ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg 
420 425 430 

aga ttg ttt gac get ttc ttt gat ctt gat cct aaa tac tgg caa gqg 
Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gin Gly 
435 440 445 



tgt ctt ttc gga cat gqc tea aac atg act agg ttg gat att gtt aca 
cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp lie val Thr 
465 470 475 480 



768 



ctt atg gat tgg agg gat tct cat ttg gqt aat gag cca tat tta agg 816 
Leu Met Asp Trp Arg Asp ser His Leu Gly Asn Glu Pro Tyr Leu Arg 
260 265 270 



864 



912 



a teg tat atg gaa gta aaa aga agg atg gtg gca aga tta agg cat 960 
u Ser Tyr Met Glu Val Lys Arg Arg Met val Ala Arg Leu Arg His 
r 05 310 315 320 



1008 



cct atg gga gga cca ctt ccg egg att cct caa aat gtt atg get att 1056 
Pro Met Gly Gly Pro Leu Pro Arg lie Pro Gin Asn Val Met Ala lie 
340 345 350 

gqt ggg aat tea ggg ata gtt cat cca tea aca gqg tac atg gtg get 
Gly Gly Asn Ser Gly lie Val His Pro Ser Thr Gly Tyr Met val Ala 
355 360 365 

agg age atg get tta gca cca gta eta get gaa gee ate gtc gag gqg 
Arg ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala lie val Glu Gly 
370 375 380 

ctt gqc tea aca aga atg ata aga ggg tct caa ctt tac cat aga gtt 
Leu Gly ser Thr Arg Met lie Arg Gly Ser Gin Leu Tyr His Arg Val 
- * * 390 395 400 



1104 



1152 



1200 



1248 



1296 



1344 



ttc ctt tct tea aga ttg tct gtc aaa gaa ctt gqt tta etc age ttg 1392 
Phe Leu Ser ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu 
450 455 460 



1440 



aaa tgt cct ctt cct ttg gtt aga ctg att ggc aat eta gca ata gag 1488 
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lvs cvs Pro Leu Pro Leu Val Arg Leu lie Gly Asn Leu Ala lie Glu 
y y 485 ~ 490 495 

age ctt tgaatgtgaa aagtttgaat cattttcttc attttaattt ctttgattat 1544 
ser Leu 

tttcatattt tetcaattge aaaagtgaga taagagctac atactgtcaa caaataaact 1604 
actattggaa agttaaaata tgtgtttgtt gtatgttatt ctaatggaat ggattttgta 1664 
aa 

<210> 48 
<211> 498 
<212> PRT 

<213> Lycopersicon esculentum 



00> 48 

Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu ser Ser Pro 
1 5 10 15 

Thr Pro His Arg ser lie Phe Gin Gin Asn Pro ser Phe Leu Ser Pro 
20 25 30 

Thr Thr Lys Lys Lys ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser 
35 40 45 

Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu 
50 55 60 

Ser Leu Asp val Asn lie ser Trp Val Asp Pro Asn Ser Asn Arg Ala 
65 70 75 80 



Phe Asp Val lie He lie Gly Ala Gly Pro Ala Gly Leu Arg Leu 
85 90 95 



Ala Glu Gin Val Ser Lys Tyr Glylle Lys val cys cys Val Asp Pro 
100 105 110 

Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly val Trp Val Asp Glu 
115 120 125 

Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met 
130 135 140 

Thr cys Val His lie Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro 
145 150 155 160 

Tyr Gly Arg val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser 
165 ~ ' 170 175 
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cys val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys val 
180 185 190 

Glu His Glu Glu Phe Glu ser Ser lie Val Cys Asp Asp Gly Lys Lvs 
195 200 205 

He Arg Gly ser Leu val Val Asp Ala Ser Gly phe Ala Ser Asp Phe 

lie Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gin lie Ala His Gly 
225 230 235 240 

Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met val 
245 250 255 



eu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg 
260 265 270 



val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp 
275 280 285 

Arg Asp Leu val Phe Leu Glu Glu Thr ser Leu val ser Arg pro Val 
290 295 300 

Leu Ser Tyr Met Glu val Lys Arg Arg Met Val Ala Arg Leu Arq His 
305 310 315 320 

Leu Gly lie Lys val Lys Ser val lie Glu Glu Glu Lys cys Val lie 
325 330 335 




Pro Met Gly Gly Pro Leu Pro Arg lie Pro Gin Asn Val Met Ala lie 
340 345 350 



ly Gly Asn Ser Gly lie val His Pro Ser Thr Gly Tyr Met val Ala 
355 360 365 



Arg ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala lie Val Glu Gly 
370 375 380 

Leu Gly Ser Thr Arg Met lie Arg Gly ser Gin Leu Tyr His Arg Val 
385 390 395 400 



Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg cys val Arg Glu cys Tyr 
405 410 415 



Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arq 
420 425 430 



Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gin Gly 
435 440 445 
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phe Leu ser ser Arg Leu ser val Lys Glu Leu Gly Leu Leu ser Leu 
450 " 455 460 

cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp lie Val Thr 
465 470 475 480 

Lvs cys Pro Leu Pro Leu val Arg Leu lie Gly Asn Leu Ala lie Glu 
485 490 495 



Ser Leu 

<210> 49 

<211> 1608 

212> DNA 

!13> Haematococcus pluvial is 



<220> 

<221> CDS 

<222> (3) . . C971) 

<223> 



<400> 49 

ct aca ttt cac aag ccc gtg age got gca age get ctg ccc cac ate 

Thr Phe His Lys Pro val Ser Gly Ala ser Ala Leu pro His lie 
15 10 15 



ggc cca cct cct cat etc cat egg tea ttt get get ace acg atg ctg 
Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu 
20 " 25 30 



tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 
Leu Val Arg Leu Arg val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 
65 70 75 

acc gtg cag get gee ggc gcg ggc gat gag cac age gee gat gta gca 
Thr Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala 
80 85 90 95 

etc cag cag ctt gac egg get ate gca gag cgt cgt gee egg cgc aaa 
Leu Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys 
100 ~ 105 110 

egg gag cag ctg tea tac cag get gee gee att gca gca tea att ggc 

seite 67 



47 



95 



143 



B~.g aag ctg cag tea ate age gte aag gee cgc cgc gtt gaa eta gee 
Ser Lys Leu Gin Ser lie ser val Lys Ala Arg Arg Val Glu Leu Ala 
35 40 45 

cgc gac ate acg egg ccc aaa gte tgc ctg cat get cag egg tgc teg 191 
Arg asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser 
50 . 55 60 



239 



287 



335 



383 
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Arq Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser lie Gly 
115 120 125 

gtg tea ggc att gec ate ttc gec acc tac ctg aga ttt gec atg cac 431 
Val Ser Gly lie Ala lie Phe Ala Thr Tyr Leu Arg Phe Ala Met His 
130 135 140 

atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 479 
Met Thr val Gly Gly Ala val Pro Trp Gly Glu Val Ala Gly Thr Leu 
145 150 155 

etc ttg gtg gtt ggt ggc gcg etc ggc atg gag atg tat gee cgc tat 527 
Leu Leu Val val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr 
160 165 170 175 

gca cac aaa gec ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 575 
Ala His Lys Ala lie Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 
180 185 190 

aag age cac cac aca cct cgc act gga ccc ttt gaa gec aac gac ttg 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 

t gca ate ate aat gga ctg ccc gee atg etc ctg tgt acc ttt ggc 671 
te Ala lie lie Asn Gly Leu Pro Ala Met Leu Leu cys Thr Phe Gly 
210 215 220 

ttc tgg ctg ccc aac gtc ctg ggg gcg gee tgc ttt gga gcg ggg ctg 719 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu 
225 230 235 



• 




623 



ggc ate acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 767 
Gly lie Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu 
240 245 250 255 

gtg cac agg cgc ttt ccc acc ggg ccc ate get ggc ctg ccc tac atg 815 
val His Arg Arg Phe Pro Thr Gly Pro lie Ala Gly Leu Pro Tyr Met 
260 265 270 

aag cgc ctg aca gtg gee cac cag eta cac cac age ggc aag tac ggt 863 
Lys Arg Leu Thr val Ala His Gin Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 911 
£ly Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His lie 
290 295 300 

^:a ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 959 
Pro Gly Ala Ala Glu Glu Val Glu Arg Leu val Leu Glu Leu Asp Trp 
305 310 ~ 315 

tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011 

Ser Lys Arg 

320 

tgataaggtg tggctagagc gatgcgtgtg agaegggtat gtcaeggteg actggtctga 1071 

tggccaatgg catcggccat gtctggtcat caegggctgg ttgcctgggt gaaggtgatg 1131 

cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191 

caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251 

catattctat ttgtgggagc tgagatgatg geatgettgg gatgtgcatg gatcatggta 1311 

gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggee ttgcacattg 1371 

catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc 1431 
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agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491 

ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551 

tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608 

<210> 50 
<211> 322 
<212> PRT 

<213> Haematococcus pluvial is 
<400> 50 

Thr Phe His Lys Pro val ser Gly Ala ser Ala Leu Pro His lie Gly 
15 10 15 




o Pro Pro His Leu His Arg ser Phe Ala Ala Thr Thr Met Leu ser 
20 25 30 

Lys Leu Gin Ser lie Ser val Lys Ala Arg Arg Val Glu Leu Ala Arg 
35 40 45 

Asp lie Thr Arg Pro Lys val Cys Leu His Ala Gin Arg cys Ser Leu 
50 ~ 55 60 

Val Arg Leu Arg val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly Thr 
65 70 75 80 

val Gin Ala Ala Gly Ala Gly Asp Glu His ser Ala Asp val Ala Leu 
85 90 95 

Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys Arg 
100 105 110 

£lu Gin Leu ser Tyr Gin Ala Ala Ala lie Ala Ala Ser lie Gly val 
115 120 125 

ser Gly lie Ala lie Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
130 135 140 

Thr val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
145 150 155 160 

Leu val val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala 
165 170 175 

His Lys Ala lie Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 
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ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 200 205 

Ala lie lie Asn Gly Leu Pro Ala Met Leu Leu cys Thr Phe Gly Phe 
210 215 220 

Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly 
225 230 235 240 

lie Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu val 
245 250 255 

His Arg Arg Phe Pro Thr Gly Pro lie Ala Gly Leu Pro Tyr Met Lys 
260 265 270 



Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly Gly 
275 280 285 



a Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His lie Pro 
290 295 300 



Gly Ala Ala Glu Glu val Glu Arg Leu val Leu Glu Leu Asp Trp Ser 
305 310 315 320 

Lys Arg 



<210> 


51 


<211> 


1163 


<212> 


ONA 


<213> 


Lycopersicon 


^20> 




H>21> 


CDS 


<222> 


(1) . . (942) 


<223> 




<400> 


51 



att egg cac gag att tea gec tec get agt tec cga ace att cgc etc 48 
lie Arg His Glu lie ser Ala Ser Ala ser Ser Arg Thr lie Arg Leu 
15 10 15 

cgt cat aac ccg ttt etc agt cca aaa tec gee tea ace gee ccg ccg 96 
Arg His Asn Pro Phe Leu ser Pro Lys Ser Ala Ser Thr Ala Pro Pro 
20 25 30 

gtt ctg ttc ttc tct ccg tta act cgc aat ttt ggc gca att ttg ctg 144 
val Leu Phe Phe Ser Pro Leu Thr Arg Asn Phe Gly Ala lie Leu Leu 
35 40 45 
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tct aga aga aag ccg aga ttg gcg gtt tgt ttt gtg ctg gag aat gag 192 
Ser Arg Arg Lys Pro Arg Leu Ala val cys Phe Val Leu Glu Asn Glu 
50 55 60 

aaa ttg aat agt act ate gaa agt gag agt gaa gta ata gag gat egg 240 
Lys Leu Asn Ser Thr lie Glu Ser Glu Ser Glu val lie Glu Asp Arg • 
65 70 75 80 

ata caa gta gag att aat gag gag aag agt tta get gee agt tgg ctg 288 
lie Gin Val Glu lie Asn Glu Glu Lys Ser Leu Ala Ala Ser Trp Leu 
85 90 95 

gcg gag aaa ttg gcg agg aag aaa teg gag agg ttt act tat ctt gtg 336 
Ala Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val 
100 105 110 

gca get gtg atg tct agt ttg ggg att act tct atg gcg att ttg gcg 384 
Ala Ala Val Met ser Ser Leu Gly lie Thr ser Met Ala lie Leu Ala 
115 120 125 



gtt tat tac aga ttt tea tgg caa atg gag ggt gqa gaa gtg cct ttt 
Ital Tyr Tyr Arg Phe ser Trp Gin Met Glu Gly Gly Glu val Pro Phe 
130 135 140 



tta tgg cac atg cac gag teg cac cat aga cca aga gaa gga cct ttt 
Leu Trp His Met His Glu Ser His His Arg Pro Arg Glu Gly Pro Phe 
180 185 190 




gaa ttg gaa gaa gta gqa gga ctt gaa gag tta gaa aag gaa gtc aac 
Glu Leu Glu Glu Val Gly Gly Leu Glu Glu Leu Glu Lys Glu Val Asn 
290 295 300 



432 



_ct gaa atg tta get aca ttc act etc teg ttt ggc get gee gta gga 480 
Ser Glu Met Leu Ala Thr Phe Thr Leu Ser Phe Gly Ala Ala val Gly 
145 150 155 160 

atg gag tac tgg gcg aga tgg get cat aga gca eta tgg cat get tct 528 
Met Glu Tyr Trp Ala Arg Trp Ala His Arg Ala Leu Trp His Ala Ser 
165 " 170 175 



576 



gag atg aac gac gtt ttc gee ata aca aat get gtt cca get ata ggt 624 
Glu Met Asn Asp Val Phe Ala lie Thr Asn Ala Val Pro Ala lie Gly 
195 200 205 

ctt ctt tec tac ggt ttc ttc cat aaa ggg ate gtc cct ggc etc tgt 672 
Leu Leu ser Tyr Gly Phe Phe His Lys Gly lie val Pro Gly Leu Cys 
210 215 220 

c ggc get gqa ttg ggg ate aca gta ttt ggg atg get tac atg ttc 720 
e Gly Ala Gly Leu Gly lie Thr Val Phe Gly Met Ala Tyr Met Phe 

230 235 240 

gtt cac gat gga ctg gtt cat aag aga ttt ccc gta ggg cct att gee 
Val His Asp Gly Leu Val His Lys Arg Phe Pro val Gly Pro lie Ala 
245 250 255 



768 



aac gtg cct tac ttt egg agg gta get gca gca cat cag ctt cat cac 816 
Asn val Pro Tyr Phe Arg Arg val Ala Ala Ala His Gin Leu His His 
260 265 270 

teg gac aaa ttt gat ggt gtc cca tat ggc ttg ttt eta gga cct aag 864 
ser Asp Lys Phe Asp Gly val Pro Tyr Gly Leu Phe Leu Gly Pro Lys 
275 280 285 



912 



cga agg att aaa att tct aag gga tta tta tgatcaaaag ataegtctga 962 
Arg Arg lie Lys lie Ser Lys Gly Leu Leu 
305 310 
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taataataaa atgcgattgt atttaggctg tagattatta ttgggaaaaa gatagaaaga 1022 

tatatatatg aatataatat aaaatgcaac aagctttcta tggagaagac cttttctttt 1082 

ttggtacctg tacgtaaaag gtgaacaatt tgatgtccta gtacttgttg acaaaccaga 1142 

agaacgataa ttcaaaacaa a 1163 

<210> 52 

<211> 314 

<212> PRT 

<213> Lycopersicon esculentum 



<400> 52 

le Arg His Glu lie ser Ala ser Ala ser Ser Arg Thr lie Arg Leu 
5 10 15 

Arg His Asn Pro Phe Leu Ser Pro Lys Ser Ala ser Thr Ala Pro Pro 
20 25 30 

Val Leu Phe Phe Ser Pro Leu Thr Arg Asn Phe Gly Ala lie Leu Leu 
35 40 45 

Ser Arg Arg Lys Pro Arg Leu Ala Val Cys Phe val Leu Glu Asn Glu 
50 55 60 

Lys Leu Asn ser Thr lie Glu ser Glu ser Glu val lie Glu Asp Arg 
65 70 75 80 

lie Gin val Glu lie Asn Glu Glu Lys ser Leu Ala Ala Ser Trp Leu 
85 90 95 

a Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val 
100 ~ 105 110 

Ala Ala Val Met Ser Ser Leu Gly lie Thr Ser Met Ala lie Leu Ala 
115 120 125 

Val Tyr Tyr Arg Phe Ser Trp Gin Met Glu Gly Gly Glu val Pro Phe 
130 ^ 135 140 

Ser Glu Met Leu Ala Thr Phe Thr Leu ser Phe Gly Ala Ala val Gly 
145 150 155 160 

Met Glu Tyr Trp Ala Arg Trp Ala His Arg Ala Leu Trp His Ala Ser 
165 170 175 

Leu Trp His Met His Glu Ser His His Arg Pro Arg Glu Gly Pro Phe 
180 185 190 
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Glu Met Asn Asp val Phe Ala lie Thr Asn Ala val Pro Ala lie Gly 
195 200 205 

Leu Leu ser Tyr Gly Phe Phe His Lys Gly lie Val Pro Gly Leu Cys 
210 215 220 

Phe Gly Ala Gly Leu Gly lie Thr val Phe Gly Met Ala Tyr Met Phe 
225 230 235 240 

Val His Asp Gly Leu val His Lys Arg Phe Pro Val Gly Pro lie Ala 
245 250 255 

Asn val Pro Tyr Phe Arg Arg Val Ala Ala Ala His Gin Leu His His 
260 265 270 

,er Asp Lys Phe Asp Gly val Pro Tyr Gly Leu Phe Leu Gly Pro Lys 
275 280 285 

Glu Leu Glu Glu Val Gly Gly Leu Glu Glu Leu Glu Lys Glu Val Asn 
290 295 300 

Arg Arg lie Lys lie ser Lys Gly Leu Leu 
305 310 

<210> 53 

<211> 1779 

<212> DNA 

<213> Arabidopsis thai i ana 



<:220> 

21> CDS 
<222> (1) . . (1779) 
<223> 



<400> 53 

atg gat etc cgt egg agg cct cct aaa cca ccg gtt acc aac aac aac 48 

Met Asp Leu Arg Arg Arg Pro Pro Lys Pro Pro Val Thr Asn Asn Asn 
1 5 10 15 

aac tec aac gqa tct ttc cgt tct tat cag cct cgc act tec gat gac 96 
Asn Ser Asn Gly Ser Phe Arg Ser Tyr Gin Pro Arg Thr ser Asp Asp 
20 25 30 

gat cat cgt cgc egg get aca aca att get cct cca ccg aaa gca tec 144 
Asp His Arg Arg Arg Ala Thr Thr lie Ala Pro Pro Pro Lys Ala Ser 
35 40 45 

gac gcg ctt cct ctt ccg tta tat etc aca aac gee gtt ttc ttc acg 192 

Seite 73 





240 



288 



336 



384 



480 



04sequ.txt 

Asp Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Ala Val Phe Phe Thr 
50 55 60 

etc ttc ttc tec gtc gcg tat tac etc etc cac egg tgg cgt gac aag 
Leu Phe Phe ser val Ala Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys 
65 70 75 80 

ate cat tac aat acg cct ctt cac gtc gtc act ate aca gaa etc ggc 
lie Arq Tyr Asn Thr Pro Leu His Val Val Thr lie Thr Glu Leu Gly 
85 90 95 

qcc att att get etc ate get teg ttt ate tat etc eta ggg ttt ttt 
Ala He lie Ala Leu lie Ala Ser Phe He Tyr Leu Leu Gly Phe Phe 
100 105 110 

qgt att gac ttt gtt cag tea ttt ate tea cgt gee tct ggt gat get 
Gly He Asp Phe val Gin ser Phe lie Ser Arg Ala ser Gly Asp Ala 
115 120 125 

tqq qat etc gec gat acg ate gat gat gat gac cac cgc ctt gtc acg 432 
Trp Asp Leu Ala Asp Thr lie Asp Asp Asp Asp His Arg Leu val Thr 
H 130 135 140 

Iic tct cca ccg act ccg ate gtt tec gtt get aaa tta cct aat ccg 
«ys Ser Pro Pro Thr pro lie Val Ser val Ala Lys Leu Pro Asn Pro 
145 150 155 160 

qaa cct att gtt ace gaa teg ctt cct gag gaa gac gag gag att gtg 
Glu Pro lie val Thr Glu ser Leu Pro Glu Glu Asp Glu Glu lie Val 
165 170 175 

aaa teg gtt ate gac gga gtt att cca teg tac teg ctt gaa tct cgt 
Lys ser val lie Asp Gly Val lie Pro Ser Tyr Ser Leu Glu ser Arg 
180 185 190 

etc ggt gat tgc aaa aga gcg gcg teg att cgt cgt gag gcg ttg cag 
Leu Gly Asp cys Lys Arg Ala Ala Ser lie Arg Arg Glu Ala Leu Gin 
195 200 205 

aqa gtc acc ggg aga teg att gaa ggg tta ccg ttg gat gga ttt gat 
Arq val Thr Gly Arg Ser lie Glu Gly Leu Pro Leu Asp Gly Phe Asp 
210 " 215 220 

tat gaa teg att ttg ggg caa tgc tgt gag atg cct gtt gga tac att 
Tyr Glu ser lie Leu Gly Gin cys cys Glu Met Pro Val Gly Tyr lie 
^5 230 235 240 

Riq att cct gtt ggg att get ggt cca ttg ttg ctt gat ggt tat gag 
Gin lie Pro val Gly lie Ala Gly Pro Leu Leu Leu Asp Gly Tyr Glu 
245 250 255 

tac tct gtt cct atg get aca acc gaa ggt tgt ttg gtt get age act 
Tyr ser val Pro Met Ala Thr Thr Glu Gly cys Leu Val Ala Ser Thr 
260 265 270 

aac aga ggc tgc aag get atg ttt ate tct ggt ggc gee acc agt acc 
Asn Arg Gly cys Lys Ala Met Phe lie Ser Gly Gly Ala Thr Ser Thr 
275 280 285 

gtt ctt aag gac ggt atg acc cga gca cct gtt gtt egg ttc get teg 
val Leu Lys Asp Gly Met Thr Arg Ala Pro Val val Arg Phe Ala Ser 
290 295 300 

gcq aqa cga get teg gag ctt aag ttt ttc ttg gag aat cca gag aac 
Ala Arq Arg Ala ser Glu Leu Lys Phe Phe Leu Glu Asn Pro Glu Asn 
305 310 315 320 

ttt gat act ttg gca gta gtc ttc aac agg teg agt aga ttt gca aga 
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528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



04sequ.txt 

Phe Asp Thr Leu Ala Val Val Phe Asn Arg ser Ser Arg Phe Ala Arg 
325 330 335 

ctg caa agt gtt aaa tgc aca ate gcg gqg aag aat get tat gta agg 
Leu Gin Ser val Lys Cys Thr lie Ala Gly Lys Asn Ala Tyr Val Arg 
340 345 350 

ttc tgt tgt agt act ggt gat get atg gqg atg aat atg gtt tct aaa 
Phe Cys Cys Ser Thr Gly Asp Ala Met Gly Met Asn Met val ser Lys 
355 360 365 

ggt gtg cag aat gtt ctt gag tat ett ace gat gat ttc cet gac atg 
Gly val Gin Asn val Leu Glu Tyr Leu Thr Asp Asp Phe Pro Asp Met 
370 375 380 

gat gtg att gga ate tct ggt aac ttc tgt teg gac aag aaa cet get 
Asp Val lie Gly lie ser Gly Asn Phe cys ser Asp Lys Lys Pro Ala 
385 390 395 400 

get gtg aac tgg att gag gga cgt ggt aaa tea gtt gtt tgc gag get 
Ala Val Asn Trp lie Glu Gly Arg Gly Lys Ser Val Val Cys Glu Ala 
405 410 415 



cat ate tea gtc act atg cca tct ate gag gtg gqg aca gtg gga gga 
His lie Ser val Thr Met Pro Ser lie Glu val Gly Thr val Gly Gly 
500 505 510 



a aca cag ctt gca tct caa tea gcg tgt tta aac ctg etc gga gtt 
^ly Thr Gin Leu Ala Ser Gin Ser Ala Cys Leu Asn Leu Leu Gly Val 
515 520 525 

aaa gga gca age aca gag teg ccg gga atg aac gca agg agg eta gcg 
Lys Gly Ala ser Thr Glu Ser Pro Gly Met Asn Ala Arg Arg Leu Ala 
530 535 540 

acg ate gta gee gga gca gtt tta get gga gag tta tct tta atg tea 
Thr lie Val Ala Gly Ala val Leu Ala Gly Glu Leu ser Leu Met Ser 
545 550 555 560 

gca att gca get gga cag ctt gtg aga agt cac atg aaa tac aat aga 
Ala lie Ala Ala Gly Gin Leu Val Arg Ser His Met Lys Tyr Asn Arg 
565 570 575 

tec age cga gac ate tct gga gca acg aca acg aca aca aca aca aca 
Ser Ser Arg Asp lie ser Gly Ala Thr Thr Thr Thr Thr Thr Thr Thr 
580 585 590 

tga 

Seite 75 



1056 



1104 



1152 



1200 



1248 



1296 



•a ate aga gga gag ate gtg aac aag gtc ttg aaa acg age gtg get 
1 lie Arg Gly Glu lie val Asn Lys val Leu Lys Thr Ser Val Ala 
420 425 430 

get tta gtc gag etc aac atg etc aag aac eta get ggc tct get gtt 
Ala Leu val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly ser Ala Val 
435 440 445 

gca ggc tct eta ggt gga ttc aac get cat gee agt aac ata gtg tct 
Ala Gly Ser Leu Gly Gly Phe Asn Ala His Ala Ser Asn lie val ser 
450 455 460 

get gta ttc ata get act ggc caa gat cca get caa aac gtg gag agt 
Ala Val Phe lie Ala Thr Gly Gin Asp Pro Ala Gin Asn val Glu Ser 
465 470 475 480 

tct caa tgc ate acc atg atg gaa get att aat gac ggc aaa gat ate 1488 
Ser Gin cys lie Thr Met Met Glu Ala lie Asn Asp Gly Lys Asp lie 
485 490 495 



1344 



1392 



1440 



1536 



1584 



1632 



1680 



1728 



1776 



1779 




04sequ . txt 

<210> 54 
<211> 592 
<212> PRT 

<213> Arabidopsis thai i ana 
<400> 54 

Met Asp Leu Arg Arg Arg Pro pro Lys Pro Pro Val Thr Asn Asn Asn 
1 5 

Asn ser Asn Gly Ser Phe Arg ser Tyr Gin Pro Arg Thr Ser Asp Asp 
20 25 30 

sp His Arg Arg Arg Ala Thr Thr lie Ala Pro Pro Pro Lys Ala ser 
35 40 45 

asd Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Ala Val Phe Phe Thr 
H 50 55 60 

Leu Phe Phe Ser val Ala Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys 
65 70 75 80 

lie Arg Tyr Asn Thr Pro Leu His Val Val Thr He Thr Glu Leu Gly 
85 90 95 

Ala lie lie Ala Leu lie Ala Ser Phe lie Tyr Leu Leu Gly Phe Phe 
100 105 110 

Gly lie Asp Phe val Gin Ser Phe He Ser Arg Ala Ser Gly Asp Ala 
115 120 125 

p Asp Leu Ala Asp Thr lie Asp Asp Asp Asp His Arg Leu val Thr 
130 135 140 

cys ser Pro Pro Thr Pro lie val Ser Val Ala Lys Leu Pro Asn Pro 
145 150 155 160 

Glu Pro lie Val Thr Glu ser Leu Pro Glu Glu Asp Glu Glu lie Val 
165 170 175 

Lys ser val He Asp Gly Val lie Pro Ser Tyr ser Leu Glu ser Arg 
180 185 190 

Leu Gly Asp cys Lys Arg Ala Ala ser lie Arg Arg Glu Ala Leu Gin 
195 ~ 200 205 

Arg Val Thr Gly Arg Ser lie Glu Gly Leu Pro. Leu Asp Gly Phe Asp 
210 215 220 

seite 76 




04sequ.txt 

Tyr Glu ser lie Leu Gly Gin Cys Cys Glu Met Pro Val Gly Tyr lie 
225 230 235 240 

Gin lie Pro val Gly lie Ala Gly Pro Leu Leu Leu Asp Gly Tyr Glu 
245 250 255 

Tyr Ser val Pro Met Ala Thr Thr Glu Gly Cys Leu val Ala ser Thr 
260 265 270 

Asn Arg Gly Cys Lys Ala Met Phe lie Ser Gly Gly Ala Thr Ser Thr 
275 280 285 

val Leu Lys Asp Gly Met Thr Arg Ala Pro val val Arg Phe Ala Ser 
290 295 300 



k la Arg Arg Ala ser Glu Leu Lys Phe Phe Leu Glu Asn Pro Glu Asn 
^5 ~ ~ 310 ' 315 320 



Phe Asp Thr Leu Ala val val Phe Asn Arg Ser Ser Arg Phe Ala Arg 



325 



33 



335 



Leu Gin ser Val Lys Cys Thr lie Ala Gly Lys Asn Ala Tyr Val Arg 
340 345 350 

Phe cys Cys Ser Thr Gly Asp Ala Met Gly Met Asn Met Val Ser Lys 
355 360 365 

Gly Val Gin Asn val Leu Glu Tyr Leu Thr Asp Asp Phe Pro Asp Met 
370 375 380 




Asp Val lie Gly lie ser Gly Asn Phe cys ser Asp Lys Lys Pro Ala 
385 390 395 400 



a Val Asn Trp lie Glu Gly Arg Gly Lys Ser Val Val Cys Glu Ala 
405 410 415 



Val lie Arg Gly Glu lie val Asn Lys Val Leu Lys Thr Ser val Ala 
420 425 430 

Ala Leu Val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly Ser Ala Val 
435 440 445 

Ala Gly Ser Leu Gly Gly Phe Asn Ala His Ala Ser Asn lie val Ser 
450 455 460 

Ala val Phe lie Ala Thr Gly Gin Asp Pro Ala Gin Asn Val Glu Ser 
465 470 475 480 



ser Gin cys lie Thr Met Met Glu Ala lie Asn Asp Gly Lys Asp lie 
485 490 495 

Seite 77 



04sequ.txt 




His He ser val Thr Met Pro Ser lie Glu Val Gly Thr Val Gly Gly 
500 505 510 

Gly Thr Gin Leu Ala Ser Gin ser Ala cys Leu Asn Leu Leu Gly Val 
515 520 525 

Lvs Glv Ala Ser Thr Glu Ser Pro Gly Met Asn Ala Arg Arg Leu Ala 
530 535 540 

Thr lie Val Ala Gly Ala Val Leu Ala Gly Glu Leu Ser Leu Met ser 
545 550 555 560 

Ala lie Ala Ala Gly Gin Leu Val Arg Ser His Met Lys Tyr Asn Arg 
565 570 575 

er ser Arg Asp lie Ser Gly Ala Thr Thr Thr Thr Thr Thr Thr Thr 
580 585 590 

<210> 55 

<211> 1401 

<212> DNA 

<213> Arabidopsis thai i ana ISPH 



<220> 

<221> CDS 

<222> CD • ■ (1401) 

<223> 




00> 55 _ 

g get gtt gcg etc caa ttc age cga tta tgc gtt cga ccg gat act 

Met Ala val Ala Leu Gin Phe ser Arg Leu Cys Val Arg Pro Asp Thr 
15 10 15 

ttc gtg egg gag aat cat etc tct gga tec gga tct etc cgc cgc egg 
Phe val Arg Glu Asn His Leu Ser Gly Ser Gly Ser Leu Arg Arg Arg 
20 25 30 

aaa get tta tea gtc egg tgc teg tct gqc gat gag aac get cct teg 
Lys Ala Leu Ser val Arg Cys Ser Ser Gly Asp Glu Asn Ala Pro Ser 
35 40 45 

cca teg gtg gtg atg gac tec gat ttc gac gee aag gtg ttc cgt aag 
Pro ser val val Met Asp ser Asp Phe Asp Ala Lys val Phe Arg Lys 
50 55 60 

aac ttg acg aga age gat aat tac aat cgt aaa gqg ttc gqt cat aag 
Asn Leu Thr Arg ser Asp Asn Tyr Asn Arg Lys Gly Phe Gly His Lys 
65 70 75 80 

gag gag aca etc aag etc atg aat cga gag tac acc agt gat ata ttg 
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48 



96 



144 



192 



240 



288 
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Glu Glu Thr Leu Lys Leu Met Asn Arg Glu Tyr Thr ser Asp lie Leu 
85 90 95 

gag aca ctg aaa aca aat ggg tat act tat tct tgg gqa gat gtt act 
Glu Thr Leu Lys Thr Asn Gly Tyr Thr Tyr ser Trp Gly Asp Val Thr 
100 105 110 

gtg aaa etc get aaa gca tat ggt ttt tgc tgg ggt gtt gag cgt get 
val Lys Leu Ala Lys Ala Tyr Gly Phe cys Trp Gly val Glu Arg Ala 
115 120 125 

gtt cag att gca tat gaa gca cga aag cag ttt cca gag gag agg ctt 
val Gin lie Ala Tyr Glu Ala Arg Lys Gin Phe Pro Glu Glu Arg Leu 
130 135 140 

tgg att act aac gaa ate att cat aac ccg ace gtc aat aag agg ttg 
Trp lie Thr Asn Glu lie lie His Asn Pro Thr val Asn Lys Arq Leu 
145 150 155 160 

gaa gat atg gat gtt aaa att att ccg gtt gag gat tea aag aaa cag 
Glu Asp Met Asp val Lys lie lie Pro Val Glu Asp ser Lys Lys Gin 
165 170 175 

t gat gta gta gag aaa gat gat gtg gtt ate ctt cct gcg ttt gga 
e Asp Val Val Glu Lys Asp Asp val val lie Leu Pro Ala Phe Gly 
180 185 190 

get ggt gtt gac gag atg tat gtt ctt aat gat aaa aag gtg caa att 
Ala Gly val Asp Glu Met Tyr Val Leu Asn Asp Lys Lys val Gin lie 
195 200 205 

gtt gac acg act tgt cct tgg gtg aca aag gtc tgg aac acg gtt gag 
Val Asp Thr Thr Cys Pro Trp val Thr Lys val Trp Asn Thr Val Glu 
210 215 220 

aag cac aag aag gqg gaa tac aca tea gta ate cat ggt aaa tat aat 
Lys His Lys Lys Gly Glu Tyr Thr ser Val lie His Gly Lys Tyr Asn 
225 230 235 240 

cat gaa gag acg att gca act gcg tct ttt gca gqa aag tac ate att 
His Glu Glu Thr lie Ala Thr Ala Ser Phe Ala Gly Lys Tyr lie lie 
245 250 255 



gta aag aac atg aaa gag gca aat tac gtt tgt gat tac att etc ggt 
val Lys Asn Met Lys Glu Ala Asn Tyr Val Cys Asp Tyr lie Leu Gly 
* 260 265 270 



Re caa tac gat gga tct age tec aca aaa gag gag ttc atg gag aaa 
Gly Gin Tyr Asp Gly Ser ser ser Thr Lys Glu Glu Phe Met Glu Lys 
275 280 285 

ttc aaa tac gca att teg aag ggt ttc gat ccc gac aat gac ctt gtc 
Phe Lys Tyr Ala lie Ser Lys Gly Phe Asp Pro Asp Asn Asp Leu val 
290 295 300 

aaa gtt ggt att gca aac caa aca acg atg eta aag gqa gaa aca gag 
Lys val Gly He Ala Asn Gin Thr Thr Met Leu Lys Gly Glu Thr Glu 
305 310 315 320 

gag ata gga aga tta etc gag aca aca atg atg cgc aag tat gga gtg 
Glu lie Gly Arg Leu Leu Glu Thr Thr Met Met Arg Lys Tyr Gly val 
325 330 335 

gaa aat gta age gga cat ttc ate age ttc aac aca ata tgc gac get 
Glu Asn val Ser Gly His Phe lie Ser Phe Asn Thr lie cys Asp Ala 
340 345 350 

act caa gag cga caa gac gca ate tat gag eta gtg gaa gag aag att 

Seite 79 
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Thr Gin Glu Arg Gin Asp Ala lie Tyr Glu Leu val Glu Glu Lys lie 
355 360 365 

gac etc atg eta gtg gtt ggc gga tgg aat tea agt aac ace tct cac 
Asp Leu Met Leu Val Val Gly Gly Trp Asn Ser ser Asn Thr ser His 
370 375 380 

ctt cag gaa ate tea gag gca egg gga ate cca tct tac tgg ate gat 
Leu Gin Glu lie Ser Glu Ala Arg Gly lie Pro Ser Tyr Trp lie Asp 
385 390 395 400 

agt gag aaa egg ata gga cct ggg aat aaa ata gee tat aag etc cac 
Ser Glu Lys Arg He Gly Pro Gly Asn Lys lie Ala Tyr Lys Leu His 
405 410 415 

tat gga gaa ctg gtc gag aag gaa aac ttt etc cca aag gga cca ata 
Tyr Gly Glu Leu Val Glu Lys Glu Asn Phe Leu Pro Lys Gly Pro lie 
420 425 430 

aca ate ggt gtg aca tea ggt gca tea acc ccg gat aag gtc gtg gaa 
Thr lie Gly val Thr ser Gly Ala ser Thr Pro Asp Lys Val Val Glu 
435 440 445 

t get ttg gtg aag gtg ttc gac att aaa cgt gaa gag tta ttg cag 
p Ala Leu Val Lys Val Phe Asp lie Lys Arg Glu Glu Leu Leu Gin 
450 455 460 




<400> 56 



et Ala val Ala Leu Gin Phe Ser Arg Leu Cys Val Arg Pro Asp Thr 
5 10 15 



Phe Val Arg Glu Asn His Leu Ser Gly Ser Gly Ser Leu Arg Arg Arg 
20 25 30 

Lys Ala Leu Ser Val Arg Cys Ser Ser Gly Asp Glu Asn. Ala Pro Ser 
35 40 45 

Pro ser val val Met Asp Ser Asp Phe Asp Ala Lys Val Phe Arg Lys 
50 55 60 

Asn Leu Thr Arg Ser Asp Asn Tyr Asn Arg Lys Gly Phe Gly His Lys 
65 70 75 80 

Glu Glu Thr Leu Lys Leu Met Asn Arg Glu Tyr Thr ser Asp lie Leu 
85 90 95 



1152 



1200 



1248 



1296 



1344 



1392 



ctg get tga 1401 

Leu Ala 

465 

<210> 56 
<211> 466 
<212> PRT 

<213> Arabidopsis thai i ana ISPH 



Seite 80 



_t , 04sequ.txt 
GIu Thr Leu Lys Thr Asn Gly Tyr Thr Tyr Ser Trp Gly Asp val Thr 
100 105 HO 

Val Lys Leu Ala Lys Ala Tyr Gly Phe cys Trp Gly yal Glu Arg Ala 



120 



125 



Val Gin lie Ala Tyr Glu Ala Arg Lys Gin Phe Pro Glu Glu Arg Leu 



135 



140 



Trp lie Thr Asn Glu lie lie His Asn Pro Thr val Asn Lys Arg Leu 



150 



155 



160 



Glu Asp Met Asp Val Lys lie lie Pro val Glu Asp Ser Lys Lys Gin 
X65 170 175 



Phe Asp val Val Glu Lys Asp Asp val val lie Leu Pro Ala Phe Gly 




185 



190 



a Gly Val Asp Glu Met Tyr Val Leu Asn Asp Lys Lys val Gin lie 
195 200 205 



Val Asp Thr Thr cys Pro Trp Val Thr Lys val Trp Asn Thr val Glu 
210 215 220 

Lys His Lys Lys Gly Glu Tyr Thr Ser val lie His Gly Lys Tyr Asn 



230 



235 



240 



His Glu Glu Thr lie Ala Thr Ala ser Phe Ala Gly Lys Tyr He He 
245 250 255 

val Lys Asn Met Lys Glu Ala Asn Tyr val cys Asp Tyr lie Leu Gly 



265 



270 




Gly Gin Tyr Asp Gly Ser ser ser Thr Lys Glu Glu Phe Met Glu Lys 
H 275 280 285 

Phe Lys Tyr Ala lie Ser Lys Gly Phe Asp Pro Asp Asn Asp Leu val 
290 295 300 

305 ^ Gly 116 Ala Gln Thr Thr Met Lys Gly Glu Tnr Glu 



310 



315 



320 



Glu lie Gly Arg Leu Leu Glu Thr Thr Met Met Arg Lys Tyr Glv val 
325 330 335 

Glu Asn Val ser Gly His Phe He ser Phe Asn Thr He cys Asp Ala 



345 



350 



Thr Gin Glu Arg Gin Asp Ala lie Tyr Glu Leu val Glu Glu Lys il 



360 



365 
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Asp Leu Met Leu Val Val glv Gly Trp^sTs^sV Asn Thr Ser His 

Leu Gin Glu He ser Glu Ala Arg Gly He Pro ser Tyr Trp He Asp 

33U 395 400 

ser Glu Lys Arg lie Gly Pro Gly Asn Lys He Ala Tyr Lys Leu His 

410 415 

Tyr Gly Glu Leu Val Glu Lys Glu Asn Phe Leu Pro Lys Gly Pro He 

425 430 

Thr He Gly val Thr ser Gly Ala ser Thr Pro Asp Lys val val Glu 

445 



Asp Ala Leu val Lys val Phe Asp He L ys Arg Glu Glu Leu Leu Gin 



460 



u Ala . 

<210> 57 

<211> 2160 

<212> DNA 

<213> Lycopersicon esculentum 

<220> 

<221> CDS 

<222> (1) . . (2160) 

<223> 

•00> 57 

53 fij ffl m «J 5? JR J£ « fl- ?S a - jj, act §f t 4 s 

10 15 

83 83 IS SS 1" S8 jK fi* S ffl S£ |« fl- s» 35 « 

25 30 

ffi a? s s; a st Se as % sr as ss 2 s? aj eg 144 

JJ 40 45 

8S? gg K S3 £ 3J ?|? ft ca, ? « tec tta tea 0? a gt |? a « 

->-> 60 

IF ~ * « as ss sg ss «? s ?s a as ?s «a as 240 

75 80 
Seite 82 
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tat ccc att cat atg aaa aat ctg tct ctg aag gaa ctt aaa caa eta 288 
Tyr Pro lie His Met Lys Asn Leu ser Leu Lys Glu Leu Lys Gin Leu 
85 90 95 



gca gat gaa eta agg tea gat aca att ttc aat gta tea aag act ggg 
Ala Asp Glu Leu Arg Ser Asp Thr lie Phe Asn val Ser Lys Thr Gly 
100 105 110 

ggt cac ctt ggc tea agt ctt ggt gtt gtt gag ctg act gtt get ctt 
Gly His Leu Gly ser ser Leu Gly Val Val Glu Leu Thr val Ala Leu 
115 120 125 

cat tat gtc ttc aat gca ccg caa gat agg att etc tgg gat gtt ggt 
His Tyr Val Phe Asn Ala Pro Gin Asp Arg lie Leu Trp Asp val Gly 
130 135 140 

cat cag tct tat cct cac aaa ate ttg act ggt aga agg gac aag atg 
His Gin ser Tyr Pro His Lys lie Leu Thr Gly Arg Arg Asp Lys Met 
145 150 155 160 

teg aca tta agg cag aca gat ggt ctt gca gga ttt act aag cga teg 
£er Thr Leu Arg Gin Thr Asp Gly Leu Ala Gly Phe Thr Lys Arg Ser 
165 170 175 



b agt gaa tat gat tgc ttt ggc ace ggc cac agt tec ace acc ate 
Glu ser Glu Tyr Asp Cys Phe Gly Thr Gly His ser ser Thr Thr lie 
180 185 190 

tea gca ggc eta ggg atg get gtt ggt aga gat eta aaa gga aga aac 
ser Ala Gly Leu Gly Met Ala val Gly Arg Asp Leu Lys Gly Arg Asn 
195 200 205 



# p 

^tta 

Leu 



cag tct aat agg cct etc aga gaa eta aga gaa gtc gca aag gga 
Gin Ser Asn Arg Pro Leu Arg Glu Leu Arg Glu Val Ala Lys Gly 
275 280 285 

gtt act aag cag att ggt ggt cct atg cat gag ctt get gca aaa gtt 
Val Thr Lys Gin lie Gly Gly Pro Met His Glu Leu Ala Ala Lys Val 
290 295 300 

gat gaa tat get cgt ggc atg att agt ggt tct gga tea aca ttg ttt 
Asp Glu Tyr Ala Arg Gly Met lie ser Gly Ser Gly Ser Thr Leu Phe 
305 310 315 320 

gaa gaa ctt gga ctt tac tat att ggt cct gtg gat ggt cac aac att 
Glu Glu Leu Gly Leu Tyr Tyr lie Gly pro val Asp Gly His Asn lie 
325 330 335 

gat gat eta att gcg att etc aaa gag gtt aga agt act aaa aca aca 
Asp Asp Leu lie Ala lie Leu Lys Glu Val Arg Ser Thr Lys Thr Thr 
340 345 350 

seite 83 



336 



384 



432 



480 



528 



576 



624 



672 



aac aat gtt att gee gta ata ggt gat ggt gee atg aca gca ggt caa 
Asn Asn val lie Ala val lie Gly Asp Gly Ala Met Thr Ala Gly Gin 
210 215 220 

get tat gaa gee atg aat aat get ggt tac ctg gac tct gac atg att 720 
Ala Tyr Glu Ala Met Asn Asn Ala Gly Tyr Leu Asp Ser Asp Met lie 
225 230 235 240 

gtt ate tta aac gac aat aga caa gtt tct tta cct act get act ctg 768 
Val lie Leu Asn Asp Asn Arg Gin val ser Leu Pro Thr Ala Thr Leu 
245 250 255 



at ggg cca gtt get cct gtt gga get eta agt agt get ttg age agg 816 
ep Gly Pro Val Ala Pro Val Gly Ala Leu ser ser Ala Leu Ser Arg 
& 260 265 270 



864 



912 



960 



1008 



1056 



04sequ.txt 

got cca gta ctg ate cat gtt gtc act gag aaa ggc aga gat tat cca 
Gly Pro val Leu He His val Val Thr Glu Lys Gly Arg Gly Tyr Pro 
355 360 365 

tat get gag aga get gca gat aag tat cat gga gtt gee aag ttt gat 
Tyr Ala Glu Arg Ala Ala Asp Lys Tyr His* Gly Val Ala Lys Phe Asp 
y 370 375 380 

cca gca aca gga aag caa ttc aaa gec agt gec aag aca cag tec tat 
pro Ala Thr cty Lys Gin Phe Lys Ala ser Ala Lys Thr Gin Ser Tyr 
385 390 395 400 

aca aca tat ttt gee gag get tta att gca gaa gca gaa gca gat aaa 
Thr Thr Tyr Phe Ala Glu Ala Leu lie Ala Glu Ala Glu Ala Asp Lys 
405 410 415 

qac att gtt gca ate cat get gec atg ggg ggt ggg ace gga atg aac 
Asp He val Ala lie His Ala Ala Met Gly Gly Gly Thr Gly Met Asn 
420 425 430 

ctt ttc cat cgt cgc ttc cca aca agg tgt ttt gat gtt gga ata gca 
feeu Phe His Arg Arg Phe Pro Thr Arg Cys Phe Asp Val Gly lie Ala 
^ 435 440 ~ 445 



• 




ct cct tct gat gaa gcg gag eta ttt cac atg gta gca act get gec 
"a Pro ser Asp Glu Ala Glu Leu Phe His Met Val Ala Thr Ala Ala 
530 535 - 540 

gee att gat gac aga cca agt tgt ttt aga tac cca aga gga aat ggg 
Ala lie Asp Asp Arg Pro ser cys Phe Arg Tyr Pro Arg Gly Asn Gly 
545 550 555 560 

ate ggt gta gag ctt ccg get gga aac aaa gga att cct ctt gag gtt 
lie Gly val Glu Leu Pro Ala Gly Asn Lys Gly He Pro Leu Glu val 
565 570 575 

ggt aaa ggt agg ata ttg att gag ggg gag aga gtg get eta ttg gga 
Gly Lys Gly Arg lie Leu lie Glu Gly Glu Arg val Ala Leu Leu Gly 
580 585 590 

tat ggc tea gca gtg cag aac tgt ttg gat get get att gtg eta gaa 
tvr Gly Ser Ala Val Gin Asn cys Leu Asp Ala Ala lie val Leu Glu 
595 600 605 



tec cgc ggc tta caa gta aca gtt gca gat gca cgt ttc tgc aaa cca 
Ser Arq Gly Leu Gin Val Thr Val Ala Asp Ala Arg Phe cys Lys Pro 
610 615 620 

Seite 84 



1104 



1152 



1200 



1248 



1296 



1344 



1392 



aa caa cat gca gta ace ttt get get gga ttg get tgt gaa ggc att 
Glu Gin His Ala val Thr Phe Ala Ala Gly Leu Ala cys Glu Gly lie 
450 455 460 

aaa cct ttc tgt gca ate tat teg tct ttc atg cag agg get tat gac 
Lvs Pro Phe Cys Ala lie Tyr Ser Ser Phe Met Gin Arg Ala Tyr Asp 
465 470 475 480 

cag gta gtg cat gac gtt gat ttg caa aag ctg ccc gtg agg ttt gca 
Gin Val Val His Asp Val Asp Leu Gin Lys Leu Pro Val Arg Phe Ala 
485 490 495 

atg gac aga gca ggt ctt gtt gga gca gat ggt cca aca cat tgt ggt 
Met Asp Arg Ala Gly Leu Val Gly Ala Asp Gly Pro Thr His Cys Gly 
500 505 510 

gca ttt gat gtt act tac atg gca tgt ctt cct aac atg gtt gta atg 1584 
Ala Phe Asp val Thr Tyr Met Ala cys Leu Pro Asn Met Val Val Met 
515 520 525 



1440 



1488 



1536 



1632 



1680 



1728 



1776 



1824 



1872 



04sequ.txt 

S3 BS SS JR 25 !R a? ® 2 as i s - « ® i 

625 630 

in as «s as as w s? sr. as f 0 sj as s.sfi f 5 ?a 

645 o:>u 

3° ss ss in ss E5 a? s; § ss a$ ssi ss & s 

SS SS 8S 35 SS SS 3S SS SS 8S SB 815 13 S3 5S S 

675 b ** u 

sr. a at as as m ss ss s as ss as as « sa 



690 



S as ss ss as as ss s?s as as ss as sa ss « taa 



<210> 58 

<211> 719 

<212> PRT 

<213> Lycopersicon esculentum 



<400> 58 

Met Ala Leu cys Ala Tyr Ala Phe Pro Gly He Leu Asn Arg Thr Gly 
1 5 ■ LU 

val val ser Asp ser ser Lys Ala Thr Pro Leu Phe Ser Gly Trp He 
20 25 



As Gly Thr Asp Leu Gin Phe Leu Phe Gin His Lys Leu Thr His Glu 




35 



val Lys Lys Arg Ser Arg Val Val Gin Ala Ser Leu ser Glu ser Gly 



50 



1920 

1968 

2016 

2064 

2112 

2160 



Glu Tyr Tyr Thr Gin Arg Pro Pro Thr Pro lie Leu Asp Thr val Asn 



65 



T yr Pro He His Met Lys Asn Leu Ser Leu Lys Glu Leu Lys Gin Leu 



Ala Asp Glu Leu Arg ser Asp Thr lie Phe Asn Val ser Lys Thr Gly 
100 105 



Gly His Leu Gly Ser ser Leu Gig Val val Glu Leu Thr Val Ala Leu 



115 

Sente 85 



04sequ.txt 



His Tyr Val Phe Asn Ala Pro Gin Asp Arg lie Leu Trp Asp Val Gly 



130 



135 



HIS 

145 



Gin Ser Tyr Pro His Lys He Leu Thr Gly Arg Arg Asp Lys Met 



150 



160 



ser Thr Leu Arg Gin Thr Asp Gly Leu Ala Gly Phe Thr Lys Arcj Ser 



165 



175 



Glu ser Glu Tyr Asp cys Phe Gly Thr Gly His ser Ser Thr Thr He 
180 185 ■ L3U 

ser Ala Gly Leu Gly Met Ala val Gly Arg Asp Leu Lys Gly Arg Asn 
195 200 205 



n Asn val He Ala Val He Gly Asp Gly Ala Met Thr Ala Gly Gin 
210 215 220 



Ala Tyr Glu Ala Met Asn Asn Ala Gly Tyr Leu Asp ser Asp Met lie 



225 



230 



240 



val lie Leu Asn Asp Asn Arg Gin val ser Leu Pro Thr Ala Thr Leu 
245 250 ^jj 



asp Gly Pro val Ala Pro Val Gly Ala Leu ser ser Ala Leu ser Arg 
* ' " 265 * 



260 



270 



Leu Gin ser Asn Arg Pro Leu Arg Glu Leu Arg Glu Val Ala Lys Gly 
275 280 28:> 



val Thr Lys Gin lie Gly Gly Pro Met His Glu Leu Ala Ala Lys Val 
290 295 300 




Gl 



p Glu Tyr Ala Arg Gly Met He ser Gly Ser Gly Ser Thr Leu Phe 
5 310 315 

u Glu Leu Gly Leu Tyr Tyr He Gly Pro Val Asp Gly His Asn He 
325 330 «•> 



Asp Asp Leu lie Ala lie Leu Lys Glu val Arg ser Thr Ly^s Thr Thr 



340 



350 



Gly Pro val Leu He His val val Thr Glu Lys Gly Arg Gly Tyr Pro 



355 



360 



Tyr Ala Glu Arg Ala Ala Asp Lys Tyr His Gly Val Ala Lys Phe Asp 



370 



375 



pro Ala Thr Gly Lys Gin Phe Lys Ala Ser Ala Lys Thr Gin ser Tyr 



385 



390 



395 
Seite 86 
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Thr Thr Tyr Phe Ala Glu Ala Leu lie Ala Glu Ala Glu Ala Asp Lys 
405. 410 415 

Asp lie val Ala lie His Ala Ala Met Gly Gly Gly Thr Gly Met Asn 
420 425 430 

Leu Phe His Arg Arg phe Pro Thr Arg Cys Phe Asp Val Gly lie Ala 
435 - 440 445 

Glu Gin His Ala val Thr Phe Ala Ala Gly Leu Ala Cys Glu Gly lie 
450 455 460 

Lys Pro Phe Cys Ala lie Tyr Ser Ser Phe Met Gin Arg Ala Tyr Asp 
465 470 475 480 



ln val Val His Asp Val Asp Leu Gin Lys Leu Pro val Arg Phe Ala 
485 490 495 



Met Asp Arg Ala Gly Leu val Gly Ala Asp Gly Pro Thr His Cys Gly 
500 505 510 




Ala Phe Asp Val Thr Tyr Met Ala Cys Leu Pro Asn Met val val Met 
515 520 525 

Ala Pro Ser Asp Glu Ala Glu Leu Phe His Met val Ala Thr Ala Ala 
530 535 540 

Ala lie Asp Asp Arg Pro Ser cys Phe Arg Tyr Pro Arg Gly Asn Gly 
545 550 555 560 

lie Gly val Glu Leu Pro Ala Gly Asn Lys Gly lie Pro Leu Glu val 
565 570 575 



fly Lys Gly Arg He Leu lie Glu Gly Glu Arg val Ala Leu Leu Gly 



585 



590 



Tyr Gly ser Ala Val Gin Asn Cys Leu Asp Ala Ala lie Val Leu Glu 
595 600 605 

Ser Arg Gly Leu Gin val Thr val Ala Asp Ala Arg Phe Cys Lys Pro 
610 615 620 

Leu Asp His Ala Leu lie Arg ser Leu Ala Lys ser His Glu Val Leu 
625 630 ~ 635 640 

lie Thr val Glu Glu Gly ser lie Gly Gly Phe Gly Ser His Val val 
645 650 655 



Gin Phe Met Ala Leu Asp Gly Leu Leu Asp Gly Lys Leu Lys Trp Arg 
660 665 670 
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Pro He val Leu Pro Asp Arg Tyr He Asp His Gly ser Pro Val Asp 
675 680 685 

Gin Leu Ala Glu Ala Gly Leu Thr Pro Ser His lie Ala Ala Thr Val 
690 695 700 

Phe Asn lie Leu Gly Gin Thr Arg Glu Ala Leu Glu Val Met Thr 
705 710 ~ 715 

<210> 59 

<211> 1434 

<212> DNA 

<213> Arabidopsis thai i ana 





0> 

~<221> CDS 
<222> (1) . . (1434) 
<223> 



<400> 59 

atg atg aca tta aac tea eta tct cca get gaa tec aaa get att tct 

Met Met Thr Leu Asn Ser Leu ser Pro Ala Glu ser Lys Ala lie Ser 
1 5 10 15 

ttc ttg gat ace tec agg ttc aat cca ate cct aaa etc tea ggt qqq 

Phe Leu Asp Thr Ser Arg Phe Asn Pro lie Pro Lys Leu Ser Gly Gly 
20 25 30 

ttt agt ttg agg agg agg aat caa gqg aga ggt ttt gga aaa ggt gtt 

Phe Ser Leu Arg Arg Arg Asn Gin Gly Arg Gly Phe Gly Lys Gly val 
35 40 45 

g tgt tea gtg aaa gtg cag cag caa caa caa cct cct cca gca tqq 

s cys ser val Lys Val Gin Gin Gin Gin Gin Pro Pro Pro Ala Trp 
50 55 60 

cct gqg aga get gtc cct gag gcg cct cgt caa tct tgg gat gga cca 

Pro Gly Arg Ala Val Pro Glu Ala Pro Arg Gin ser Trp Asp Gly pro 

65 70 75 80 

aaa ccc ate tct ate gtt gga tct act ggt tct att ggc act cag aca 

Lys Pro lie Ser lie Val Gly ser Thr Gly ser lie Gly Thr Gin Thr 
85 90 95 

ttg gat att gtg get gag aat cct gac aaa ttc aga gtt gtg get eta 

Leu Asp lie val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu 
100 105 110 

get get ggt teg aat gtt act eta ctt get gat cag gta agg aga ttt 

Ala Ala Gly Ser Asn val Thr Leu Leu Ala Asp Gin val Arg Arg phe 
115 120 125 

aag cct gca ttg gtt get gtt aga aac gag tea ctg att aat gag ctt 
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Lys Pro Ala Leu val Ala Val Arg Asn Glu ser Leu lie Asn Glu Leu 
130 135 140 

aaa gag get tta get gat ttg gac tat aaa etc gag att att cca gga 
Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Leu Glu lie lie Pro Gly 
145 150 155 160 

gag caa gga gtg att gag gtt gec cga cat cct gaa get gta acc gtt 
Glu Gin Gly val lie Glu Val Ala Arg His Pro Glu Ala Val Thr val 
165 170 175 

gtt acc gga ata gta ggt tgt gcg gga eta aag cct acg gtt get gca 
val Thr Gly lie val Gly cys Ala Gly Leu Lys Pro Thr Val Ala Ala 
180 185 190 

att gaa gca gga aag gac att get ctt gca aac aaa gag aca tta ate 
lie Glu Ala Gly Lys Asp lie Ala Leu Ala Asn Lys Glu Thr Leu lie 
195 200 205 

gca ggt ggt cct ttc gtg ctt ccg ctt gee aac aaa cat aat gta aag 
Ala Gly Gly Pro Phe val Leu pro Leu Ala Asn Lys His Asn val Lys 
210 215 220 



• 



k t ctt ccg gca gat tea gaa cat tct gee ata ttt cag tgt att caa 
Leu Pro Ala Asp Ser Glu His ser Ala lie Phe Gin cys lie Gin 
5 230 235 240 



ggt ttg cct gaa ggc get ctg cgc aag ata ate ttg act gca tct ggt 
Gly Leu Pro Glu Gly Ala Leu Arg Lys lie lie Leu Thr Ala Ser Gly 
245 250 255 

gga get ttt agg gat tgg cct gtc gaa aag eta aag gaa gtt aaa gta 
Gly Ala Phe Arg Asp Trp Pro val Glu Lys Leu Lys Glu val Lys val 
260 265 270 

gcg gat gcg ttg aag cat cca aac tgg aac atg gga aag aaa ate act 
Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys lie Thr 
275 280 285 

gtg gac tct get acg ctt ttc aac aag ggt ctt gag gtc att gaa gcg 
val Asp ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val lie Glu Ala 
290 295 300 



cat tat ttg ttt gga get gag tat gac gat ata gag att gtc att cat 
His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp lie Glu lie val lie His 
305 310 315 320 



g caa agt ate ata cat tec atg att gaa aca cag gat tea tct gtg 
o Gin ser lie lie His ser Met lie Glu Thr Gin Asp ser ser val 
325 330 335 

ctt get caa ttg ggt tgg cct gat atg cgt tta ccg att etc tac acc 
Leu Ala Gin Leu Gly Trp Pro Asp Met Arg Leu Pro lie Leu Tyr Thr 
340 345 " 350 

atg tea tgg ccc gat aga gtt cct tgt tct gaa gta act tgg cca aga 
Met ser Trp Pro Asp Arg Val Pro cys ser Glu val Thr Trp Pro Arg 
355 360 365 

ctt gac ctt tgc aaa etc ggt tea ttg act ttc aag aaa cca gac aat 
Leu Asp Leu Cys Lys Leu Gly ser Leu Thr Phe Lys Lys Pro Asp Asn 
370 375 380 

gtg aaa tac cca tec atg gat ctt get tat get get gga cga get gga 
Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly 
385 390 395 " 400 

ggc aca atg act gga gtt etc age gee gee aat gag aaa get gtt gaa 
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Gly Thr Met Thr Gly val Leu ser Ala Ala Asn Glu Lys Ala val Glu 
405 410 415 

atg ttc att gat gaa aag ata age tat ttg gat ate ttc aag gtt gtg 1296 
Met Phe lie Asp Glu Lys lie Ser Tyr Leu Asp lie Phe Lys Val Val 
420 425 430 

gaa tta aca tgc gat aaa cat cga aac gag ttg gta aca tea ccg tct 1344 
Glu Leu Thr cys Asp Lys His Arg Asn Glu Leu Val Thr ser Pro Ser 
435 440 445 

ctt gaa gag att gtt cac tat gac ttg tgg gca cgt gaa tat gee gcg 1392 
Leu Glu Glu lie Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala 
450 455 460 

aat gtg cag ctt tct tct ggt get agg cca gtt cat gca tga 1434 
Asn val Gin Leu ser ser Gly Ala Arg Pro val His Ala 
465 470 ' 475 



<210> 60 

<211> 477 

2> PRT 

^13> Arabidopsis thai i ana 




<400> 60 

Met Met Thr Leu Asn Ser Leu ser Pro Ala Glu Ser Lys Ala lie Ser 
15 10 15 

Phe Leu Asp Thr Ser Arg Phe Asn Pro lie Pro Lys Leu Ser Gly Gly 
20 25 30 

Phe Ser Leu Arg Arg Arg Asn Gin Gly Arg Gly Phe Gly Lys Gly Val 
35 40 45 

Lys cys Ser Val Lys val Gin Gin Gin Gin Gin Pro Pro Pro Ala Trp 
50 55 60 

! o Gly Arg Ala Val Pro Glu Ala Pro Arg Gin Ser Trp Asp Gly Pro 

70 75 80 

Lys Pro lie Ser lie Val Gly ser Thr Gly Ser lie Gly Thr Gin Thr 
85 90 95 

Leu Asp lie val Ala Glu Asn Pro Asp Lys Phe Arg Val val Ala Leu 
100 105 ~ 110 

Ala Ala Gly Ser Asn val Thr Leu Leu Ala Asp Gin Val Arg Arg Phe 
115 120 125 

Lys Pro Ala Leu val Ala Val Arg Asn Glu ser Leu lie Asn Glu Leu 
130 135 140 
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Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Leu Glu lie lie Pro Gly 
145 150 155 160 

Glu Gin Gly val lie Glu val Ala Arg His Pro Glu Ala Val Thr Val 
165 170 175 

Val Thr Gly lie Val Gly cys Ala Gly Leu Lys Pro Thr Val Ala Ala 
180 185 190 

lie Glu Ala Gly Lys Asp lie Ala Leu Ala Asn Lys Glu Thr Leu lie 
195 200 205 

Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys 
210 215 220 



lie Leu Pro Ala Asp Ser Glu His Ser Ala lie Phe Gin Cys lie Gin 
225 230 235 240 



Leu Pro Glu Gly Ala Leu Arg Lys lie lie Leu Thr Ala Ser Gly 
245 250 255 



Gly Ala Phe Arg Asp Trp Pro val Glu Lys Leu Lys Glu Val Lys Val 
260 265 270 

Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys lie Thr 
275 280 285 

Val Asp ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val lie Glu Ala 
290 295 300 

His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp lie Glu lie Val lie His 
305 310 315 320 




pro Gin ser lie lie His Ser Met lie Glu Thr Gin Asp Ser Ser val 
325 330 335 



u Ala Gin Leu Gly Trp Pro Asp Met Arg Leu Pro lie Leu Tyr Thr 
340 345 ~ 350 



Met ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg 
355 360 365 

Leu Asp Leu cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn 
370 375 380 

Val Lys Tyr pro ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly 
385 390 395 400 

Gly Thr Met Thr Gly Val Leu ser Ala Ala Asn Glu Lys Ala Val Glu 
405 410 415 
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Met Phe lie Asp Glu Lys lie Ser Tyr Leu Asp lie Phe Lys val Val 
420 425 430 

Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu val Thr Ser Pro Ser 
435 440 445 

Leu Glu Glu lie val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala 
450 455 460 

Asn Val Gin Leu Ser Ser Gly Ala Arg Pro Val His Ala 
465 470 475 

<210> 61 

<211> 884 

<212> DNA 

13> Adonis palaestina clone AplPi28 




<220> 
<221> CDS 
<222> (180) . . (884) 
<223> 



<400> 61 

cgtcgatcag gattaatcct ttatatagta tcttctccac caccactaaa acattatcag 60 

cttcgtgttc ttctcccgct gttcatcttc agcagcgttg tcgtactctt tctatttctt 120 

cttccatcac taacagtcct cgccgagggt tgaatcggct gttcgcctca acgtcgact 179 

atg ggt gaa gtc get gat get ggt atg gat gec gtc cag aag egg ctt 227 
Met Gly Glu Val Ala Asp Ala Gly Met Asp Ala val Gin Lys Arg Leu 
J 5 10 15 

g ttc gac gat gaa tgt att ttg gtg gat gag aat gac aag gtc gtc 275 
t Phe Asp Asp Glu Cys lie Leu vat Asp Glu Asn Asp Lys Val val 
20 25 30 

gga cat gat tec aaa tac aac tgt cat ttg atg gaa aag ata gag gca 323 
Gly His Asp Ser Lys Tyr Asn Cys His Leu Met Glu Lys lie Glu Ala 
35 40 45 

gaa aac ttg ctt cac aga gec ttc agt gtt ttc tta ttc aac tea aaa 371 
Glu Asn Leu Leu His Arg Ala Phe ser val Phe Leu Phe Asn ser Lys 
50 55 60 

tac gag ttg ctt ctt cag caa cga tct gca acg aag gta aca ttc ccg 419 
Tyr Glu Leu Leu Leu Gin Gin Arg ser Ala Thr Lys Val Thr Phe Pro 
65 70 75 80 

etc gta tgg aca aac ace tgt tgc age cat ccc etc ttc cgt gat tec 467 
Leu val Trp Thr Asn Thr cys Cys Ser His Pro Leu Phe Arg Asp Ser 
85 90 95 

gaa etc ata gaa gaa aat ttt etc ggg gta cga aac get gca caa agg 515 
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Glu Leu lie Glu Glu Asn Phe Leu Gly val Arg Asn Ala Ala Gin Arg 
100 105 110 

aag ctt tta gac gag eta ggc att cca get gaa gac gta cca gtt gat 
lvs Leu Leu Asp Glu Leu Gly lie Pro Ala Glu Asp Val Pro Val Asp 
y 115 120 125 

gaa ttc act cct ctt ggt cgc att ctt tac aaa get cca tct gac gga 
Glu Phe Thr Pro Leu Gly Arg lie Leu Tyr Lys Ala Pro ser Asp Gly 
130 135 140 

aaa tgg gga gag cac gaa ctg gac tat ctt ctg ttt att gtc cga gat 
lvs Tro Gly Glu His Glu Leu Asp Tyr Leu Leu Phe lie Val Arg Asp 
145 150 155 160 

gtg aaa tac gat cca aac cca gat gaa gtt get gac get aag tac gtt 
val Lys Tyr Asp Pro Asn Pro Asp Glu val Ala Asp Ala Lys Tyr Val 
165 170 175 

aat cgc gag gag ttg aaa gag ata ctg aga aaa get gat gca ggt gaa 
Asn Arg Glu Glu Leu Lys Glu lie Leu Arg Lys Ala Asp Ala Gly Glu 
180 185 190 



gga ata aag ttg tct cct tgg ttt aga ttg gtt gtg gat aac ttt 
Gly lie Lys Leu Ser Pro Trp Phe Arg Leu val val Asp Asn Phe 
195 200 205 



* ttg ttc aag tgg tgg gat cat gta gag gag ggg aag att aag gac gtc 
Leu Phe Lys Trp Trp Asp His Val Glu Glu Gly Lys lie Lys Asp Val 
210 215 220 

gee gac atg aaa act ate cac aag ttg act taa 
Ala Asp Met Lys Thr lie His Lys Leu Thr 
225 230 

<210> 62 

<211> 234 

<212> PRT 

<213> Adonis palaestina clone ApIPl28 



00> 62 

t Gly Glu val Ala Asp Ala Gly Met Asp Ala Val Gin Lys Arg Leu 
5 10 15 

Met Phe Asp Asp Glu Cys lie Leu Val Asp Glu Asn Asp Lys Val Val 
20 25 30 

Gly His Asp ser Lys Tyr Asn cys His Leu Met Glu Lys lie Glu Ala 
35 40 45 

Glu Asn Leu Leu His Arg Ala Phe ser val Phe Leu Phe Asn ser Lys 
50 55 60 

Tvr Glu Leu Leu Leu Gin Gin Arg ser Ala Thr Lys Val Thr Phe Pro 
65 70 ~ 75 80 




563 



611 



659 



707 



755 



803 



851 



884 
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Leu val Trp Thr Asn Thr cys cys ser His Pro Leu Phe Arg Asp Ser 
85 90 95 

Glu Leu lie Glu Glu Asn Phe Leu Gly val Arg Asn Ala Ala Gin Arg 
100 105 110 

Lys Leu Leu Asp Glu Leu Gly lie Pro Ala Glu Asp Val Pro val Asp 
115 120 125 

Glu Phe Thr Pro Leu Gly Arg lie Leu Tyr Lys Ala Pro Ser Asp Gly 
130 135 140 

Lvs Trp Gly Glu His Glu Leu Asp Tyr Leu Leu Phe lie val Arg Asp 
145 150 155 160 

val lvs Tyr Asp Pro Asn Pro Asp Glu val Ala Asp Ala Lys Tyr Val 
165 170 175 



» 



Arg Glu Glu Leu Lys Glu lie Leu Arg Lys Ala Asp Ala Gly Glu 
180 185 190 



Glu Gly lie Lys Leu ser Pro Trp Phe Arg Leu Val val Asp Asn Phe 
195 200 205 

Leu Phe Lys Trp Trp Asp His val Glu Glu Gly Lys lie Lys Asp val 
210 215 220 

Ala Asp Met Lys Thr lie His Lys Leu Thr 
225 230 

<210> 63 

<211> 1402 

<212> DNA 

13> Arabidopsis thai i ana 



<220> 

<221> CDS 

<222> (52) . . (1317) 

<223> 



<400> 63 

aaqtctttqc ctctttggtt tactttcctc tgttttcgat ccatttagaa a atg tta 
y * Met Leu 

1 

ttc acg agg agt gtt get egg att tct tct aag ttt ctg aga aac cgt 
Phe Thr Arg Ser val Ala Arg lie ser Ser Lys Phe Leu Arg Asn Arg 
5 10 15 
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age ttc tat ggc tec tct caa tct etc gee tct cat egg ttc gca ate 
Ser Phe Tyr Gly ser ser Gin Ser Leu Ala ser His Arg Phe Ala lie 
20 25 30 



gtt tgc aga aca act tat tea ttg aaa tct ccg gtt ttt gqt gga ttt 
val cys Arg Thr Thr Tyr Ser Leu Lys ser Pro val Phe Gly Gly Phe 
55 60 65 



gac cca ttt teg ctt gtt gee gat gag ctg tea ctt ctt agt aat aag 
Asp Pro Phe ser Leu val Ala Asp Glu Leu Ser Leu Leu ser Asn Lys 
85 90 95 




prg tac ttc ttc aaa agg gqt gtq caa gga aaa cag ttt cgt tea act 
Glu Tyr Phe Phe Lys Arg Gly val Gin Gly Lys Gin Phe Arg ser Thr 
115 120 125 130 



ttg att ggg gaa tea aca gat ata gtc aca tea gaa tta cgc gta agg 
Leu lie Gly Glu ser Thr Asp lie val Thr Ser Glu Leu Arg val Arg 
150 155 160 

caa egg gqt att get gaa ate act gaa atg ata cac gtc gca agt eta 
Gin Arg Gly lie Ala Glu lie Thr Glu Met lie His Val Ala Ser Leu 
165 170 175 

ctg cac gat gat gtc ttg gat gat gee gat aca agg cgt gqt gtt gqt 
Leu His Asp Asp val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly 
180 185 190 

tec tta aat gtt gta atg gqt aac aag atg teg gta tta gca gga gac 
ler Leu Asn val Val Met Gly Asn Lys Met Ser val Leu Ala Gly Asp 

200 205 210 

ttc ttg etc tec egg get tgt ggg get etc get get tta aag aac aca 
Phe Leu Leu Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys Asn Thr 
215 220 225 

gag gtt gta gca tta ctt gca act get gta gaa cat ctt gtt ace ggt 
Glu Val Val Ala Leu Leu Ala Thr Ala val Glu His Leu Val Thr Gly 
230 235 240 

gaa ace atg gag ata act agt tea acc gag cag cgt tat agt atg gac 
Glu Thr Met Glu lie Thr ser ser Thr Glu Gin Arg Tyr Ser Met Asp 
245 250 255 




age tgc aaa get gtt gee gtt etc act gga caa aca gca gaa gtt gee 

Ser Cys Lys Ala Val Ala val Leu Thr Gly Gin Thr Ala Glu Val Ala 

275 280 285 290 

Seite 95 



153 



att cec gat cag ggt cac tct tgt tct gac tct cca cac aag gqt tac 201 
lie Pro Asp Gin Gly His ser cys Ser Asp ser Pro His Lys Gly Tyr 
35 40 45 50 



249 



agt cat caa etc tat cac cag agt age tec ttg gtt gag gag gag ctt 297 
Ser His Gin Leu Tyr His Gin ser ser ser Leu val Glu Glu Glu Leu 
70 75 80 



345 



ttg aga gag atg gta ctt gee gag gtt cca aag ctt gee tct get get 393 
u Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala 
100 105 110 



441 



att ttg ctg ctg atg gcg aca get ctg gat gta cga gtt cca gaa gca 489 
lie Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg val Pro Glu Ala 
135 140 " 145 



537 



585 



633 



681 



729 



777 



825 



tac tac atg cag aag aca tat tat aag aca gca teg eta ate tct aac 873 
Tyr Tyr Met Gin Lys Thr Tyr Tyr Lys Thr Ala Ser Leu lie ser Asn 
260 265 270 



921 
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gtg tta get ttt gag tat ggg agg aat ctg ggt tta gca ttc caa tta 

VaT Leu Ala Phe Glu Tyr Gly Arg asp Leu Gly Leu Ala Phe Gin Leu 
295 300 305 

ata gac gac att ctt gat ttc acg gqc aca tct gec tct etc gqa aag 
lie Asp Asp lie Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys 
310 315 320 

gqa teg ttg tea gat att cgc cat gga gtc ata aca gec cca ate etc 
Gly ser Leu Ser Asp lie Arg His Gly val lie Thr Ala Pro lie Leu 
325 330 335 



gaa aaa gat cct agg aat gtt gac att get tta gag tat ctt ggg aag 
Glu Lys Asp Pro Arg Asn val Asp lie Ala Leu Glu Tyr Leu Gly Lys 
355 360 365 370 




Ita gca gca get gca ate ggg tct eta cct gaa aca gac aat gaa gat 
Leu Ala Ala Ala Ala lie Gly ser Leu Pro Glu Thr Asp Asn Glu Asp 
390 395 400 




969 



1017 



1065 



ttt gee atg gaa gag ttt cct caa eta cgc gaa gtt gtt gat caa gtt 1113 
Phe Ala Met Glu Glu Phe Pro Gin Leu Arg Glu val val Asp Gin val 
340 345 350 



1161 



age aag gga ata cag agg gca aga gaa tta gee atg gaa cat gcg aat 1209 
" r Lys Gly lie Gin Arg Ala Arg Glu Leu Ala Met Glu His Ala Asn 
375 380 385 



1257 



gtc aaa aga teg agg egg gca ctt att gac ttg acc cat aga gtc ate 1305 
val Lys Arg ser Arg Arg Ala Leu lie Asp Leu Thr His Arg Val lie 
405 410 415 

acc aga aac aag tgagattaag taatgtttct ctctatacac caaaacattc 1357 
Thr Arg Asn Lys 
420 

ctcatttcat ttgtaggatt ttgttggtcc aattcgtttc acgaa 1402 

<210> 64 

<211> 422 

<212> PRT 

13> Arabidopsis thai i ana 



<400> 64 

Met Leu Phe Thr Arg Ser Val Ala Arg lie Ser ser Lys Phe Leu Arg 
15 10 15 

Asn Arg Ser Phe Tyr Gly Ser Ser Gin ser Leu Ala ser His Arg Phe 
20 25 30 

Ala lie lie Pro Asp Gin Gly His Ser Cys Ser Asp Ser Pro His Lys 
35 40 45 

Gly Tyr val Cys Arg Thr Thr Tyr ser Leu Lys Ser Pro val Phe Gly 
50 55 60 
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Gly Phe ser His Gin Leu Tyr His Gin ser Ser ser Leu val Glu Glu 
65 70 75 80 

Glu Leu Asp Pro Phe Ser Leu val Ala Asp Glu Leu Ser Leu Leu Ser 
85 90 95 

Asn Lys Leu Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser 
100 105 110 

Ala Ala Glu Tyr Phe Phe Lys Arg Gly Val Gin Gly Lys Gin Phe Arg 
115 120 125 

Ser Thr lie Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg val Pro 
130 135 140 



Glu Ala Leu lie Gly Glu Ser Thr Asp lie Val Thr Ser Glu Leu Arg 
145 150 155 160 



Arg Gin Arg Gly lie Ala Glu lie Thr Glu Met lie His Val Ala 
165 170 175 



Ser Leu Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly 
180 185 190 

val Gly Ser Leu Asn Val val Met Gly Asn Lys Met Ser val Leu Ala 
195 200 205 

Gly Asp Phe Leu Leu ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys 
y 210 215 220 

Asn Thr Glu Val Val Ala Leu Leu Ala Thr Ala val Glu His Leu Val 
225 230 235 240 




Thr Gly Glu Thr Met Glu He Thr Ser Ser Thr Glu Gin Arg Tyr Ser 
245 250 255 



t Asp Tyr Tyr Met Gin Lys Thr Tyr Tyr Lys Thr Ala Ser Leu lie 
260 265 270 



Ser Asn ser cys Lys Ala val Ala val Leu Thr Gly Gin Thr Ala Glu 
275 280 285 

Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe 
290 295 ~ 300 

Gin Leu lie Asp Asp lie Leu Asp Phe Thr Gly Thr Ser Ala ser Leu 
305 310 315 320 

Gly Lys Gly ser Leu ser Asp lie Arg His Gly Val lie Thr Ala Pro 
325 330 335 
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lie Leu Phe Ala Met Glu Glu Phe Pro Gin Leu Arg Glu Val val Asp 
340 345 350 

Gin Val Glu Lys Asp Pro Arg Asn Val Asp He Ala Leu Glu Tyr Leu 
355 360 365 

Gly Lys ser Lys Gly lie Gin Arg Ala Arg Glu Leu Ala Met Glu His 
y 370 375 380 

Ala Asn Leu Ala Ala Ala Ala He Gly Ser Leu Pro Glu Thr Asp Asn 
385 390 395 400 

Glu Asp val Lys Arg Ser Arg Arg Ala Leu lie Asp Leu Thr His Arg 
405 " 410 415 

Val lie Thr Arg Asn Lys 
420 




0> 65 

<211> 1155 

<212> DNA 

<213> Arabidopsis thai i ana 
<220> 

<221> CDS 

<222> (1).-C1155) 

<223> 



<400> 65 

tq agt gtg agt tgt tgt tgt agg aat ctg ggc aag aca ata aaa aag 

tet Ser val Ser Cys Cys Cys Arg Asn Leu Gly Lys Thr lie Lys Lys 
5 10 15 



qca ata cct tea cat cat ttg cat ctg aga agt ctt ggt ggg agt etc 
Ala lie Pro ser His His Leu His Leu Arg Ser Leu Gly Gly Ser Leu 
20 25 30 

tat cgt cgt cgt ate caa age tct tea atg gag ace gat etc aag tea 
Tyr Arg Arg Arg He Gin ser ser ser Met Glu Thr Asp Leu Lys ser 
35 40 45 

acc ttt etc aac gtt tat tct gtt etc aag tct gac ctt ctt cat gac 
Thr Phe Leu Asn val Tyr Ser val Leu Lys ser Asp Leu Leu His Asp 
50 55 60 

cct tec ttc gaa ttc acc aat gaa tct cgt etc tgg gtt gat egg atg 
Pro Ser Phe Glu Phe Thr Asn Glu ser Arg Leu Trp val Asp Arg Met 
65 70 75 80 

ctg gac tac aat gta cgt gga ggg aaa etc aat egg ggt etc tct gtt 
Leu Asp Tyr Asn val Arg Gly Gly Lys Leu Asn Arg Gly Leu ser val 
85 90 95 

seite 98 



04sequ.txt 

gtt gac agt ttc aaa ctt ttg aag caa ggc aat gat ttg act gag caa 
val Asp ser Phe Lys Leu Leu Lys Gin Gly Asn Asp Leu Thr Glu Gin 
100 105 110 

gag gtt ttc etc tct tgt get etc ggt tgg tgc att gaa tgg etc caa 
Glu Val Phe Leu Ser Cys Ala Leu Gly Trp cys lie Glu Trp Leu Gin 
115 120 125 

get tat ttc ctt gtg ctt gat gat att atg gat aac tct gtc act cgc 
Ala Tyr Phe Leu val Leu Asp Asp lie Met Asp Asn ser Val Thr Arg 
130 135 140 

cgt ggt caa cct tgc tgg ttc aga gtt cct cag gtt ggt atg gtt gee 
Arg Gly Gin Pro cys Trp Phe Arg Val Pro Gin Val Gly Met Val Ala 
145 150 " 155 160 

ate aat gat ggg att eta ctt cgc aat cac ate cac agg att etc aaa 
lie Asn Asp Gly lie Leu Leu Arg Asn His lie His Arg lie Leu Lys 
165 170 175 



Asn Glu Val Glu Leu Gin Thr Ala cys Gly Gin Met lie Asp Leu lie 
195 200 205 

ace acc ttt gaa gga gaa aag gat ttg gee aag tac tea ttg tea ate 

Thr Thr Phe Glu Gly Glu Lys Asp Leu Ala Lys Tyr Ser Leu ser lie 
210 215 220 




ata gga aca gat ata gaa gat ttc aaa tgc teg tgg ttg gtg gtt aag 
lie Gly Thr Asp lie Glu Asp Phe Lys Cys ser Trp Leu Val Val Lys 
290 295 300 



336 



384 



432 



480 



528 



aag cat ttc cgt gat aag cct tac tat gtt gac ctt gtt gat ttg ttt 576 
s His Phe Arg Asp Lys Pro Tyr Tyr Val Asp Leu val Asp Leu Phe 
180 185 190 



t gag gtt gag ttg caa aca get tgt ggc cag atg ata gat ttg ate 624 

1\ 



672 



cac cgt cgt att gtc cag tac aaa acg get tat tac tea ttt tat etc 720 
His Arg Arg lie Val Gin Tyr Lys Thr Ala Tyr Tyr ser Phe Tyr Leu 
225 230 235 240 

cct gtt get tgt gcg ttg ctt atg gcg ggc gaa aat ttg gaa aac cat 768 
Pro val Ala cys Ala Leu Leu Met Ala Gly Glu Asn Leu Glu Asn His 
245 250 255 

att gac gtg aaa aat gtt ctt gtt gac atg gga ate tac ttc caa gtg 
lie Asp val Lys Asn Val Leu Val Asp Met Gly lie Tyr Phe Gin Val 
260 265 270 

cag gat gat tat ctg gat tgt ttt get gat ccc gag acg ctt ggc aag 864 
Hn Asp Asp Tyr Leu Asp cys Phe Ala Asp Pro Glu Thr Leu Gly Lys 
™ 275 280 285 



816 



912 



gca tta gag cgc tgc age gaa gaa caa act aag ata tta tat gag aac 960 

Ala Leu Glu Arg Cys Ser Glu Glu Gin Thr Lys lie Leu Tyr Glu Asn 
305 310 315 320 

tat ggt aaa ccc gac cca teg aac gtt get aaa gtg aag gat etc tac 1008 

Tyr Gly Lys Pro Asp Pro Ser Asn val Ala Lys val Lys Asp Leu Tyr 

325 330 335 

aaa gag ctg gat ctt gag gga gtt ttc atg gag tat gag age aaa age 1056 

Lys Glu Leu Asp Leu Glu Gly Val Phe Met Glu Tyr Glu ser Lys Ser 
340 345 350 

tac gag aag ctg act gga gcg att gag gga cac caa agt aaa gca ate 1104 

Tyr Glu Lys Leu Thr Gly Ala lie Glu Gly His Gin ser Lys Ala lie 
355 360 365 

Seite 99 
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caa qca gtg eta aaa tec ttc ttg get aag ate tac aag agg cag aag 1152 
Gin Ala Val Leu Lys ser Phe Leu Ala Lys He Tyr Lys Arg Gin Lys 
370 375 380 




tag 

<210> 66 

<211> 384 

<212> PRT 

<213> Arabidopsis thai i ana 

<400> 66 

Met ser Val ser cys Cys cys Arg Asn Leu Gly Lys Thr lie Lys Lys 
1 5 10 15 

lie Pro ser His His Leu His Leu Arg Ser Leu Gly Gly Ser Leu 
20 25 . 30 

Tyr Arg Arg Arg lie Gin Ser Ser Ser Met Glu Thr Asp Leu Lys Ser 
35 40 45 

Thr Phe Leu Asn val Tyr ser Val Leu Lys ser Asp Leu Leu His Asp 
50 55 60 

pro Ser Phe Glu Phe Thr Asn Glu ser Arg Leu Trp Val Asp Arg Met 
65 70 75 80 

Leu Asp Tyr Asn val Arg Gly Gly Lys Leu Asn Arg Gly Leu Ser val 
85 ~ 90 95 

Val Asp ser Phe Lys Leu Leu Lys Gin Gly Asn Asp Leu Thr Glu Gin 
100 105 110 

u Val Phe Leu Ser Cys Ala Leu Gly Trp cys lie Glu Trp Leu Gin 
115 120 125 

Ala Tyr Phe Leu val Leu Asp Asp lie Met Asp Asn Ser Val Thr Arg 
130 135 140 

Arg Gly Gin Pro cys Trp Phe Arg val Pro Gin Val Gly Met val Ala 
145 150 155 160 

He Asn Asp Gly lie Leu Leu Arg Asn His lie His Arg lie Leu Lys 
165 170 175 

Lys His Phe Arg Asp Lys Pro Tyr Tyr Val Asp Leu Val Asp Leu Phe 
180 185 190 

seite 100 




1155 
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Asn Glu Val Glu Leu Gin Thr Ala Cys Gly Gin Met lie Asp Leu lie 
195 200 205 

Thr Thr Phe Glu Gly Glu Lys Asp Leu Ala Lys Tyr Ser Leu ser lie 
210 215 220 

His Arg Arg lie val Gin Tyr Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu 
225 230 235 240 

Pro Val Ala Cys Ala Leu Leu Met Ala Gly Glu Asn Leu Glu Asn His 
245 250 255 

lie Asp val Lys Asn val Leu val Asp Met Gly lie Tyr phe Gin Val 
260 265 270 

Gin Asp Asp Tyr Leu Asp cys Phe Ala Asp Pro Glu Thr Leu Gly Lys 
275 280 285 



# 



Gly Thr Asp lie Glu Asp Phe Lys Cys Ser Trp Leu val val Lys 
290 295 300 



Ala Leu Glu Arg cys ser Glu Glu Gin Thr Lys lie Leu Tyr Glu Asn 
305 310 315 320 

Tyr Gly Lys Pro Asp Pro ser Asn val Ala Lys val Lys Asp Leu Tyr 
325 330 335 

Lys Glu Leu Asp Leu Glu Gly val Phe Met Glu Tyr Glu ser Lys ser 
340 345 350 

Tyr Glu Lys Leu Thr Gly Ala lie Glu Gly His Gin ser Lys Ala lie 
355 360 365 

Gin Ala val Leu Lys ser Phe Leu Ala Lys lie Tyr Lys Arg Gin Lys 
370 375 380 

10> 67 

<211> 1101 

<212> DNA 

<213> si nabs alba 



<220> 

<221> CDS 

<222> (1) . . (1101) 

<223> 

Seite 101 
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<400> 67 

atg get tct tea gtg act cct eta ggt tea tgg gtt ctt ctt cac cat 
Met Ala ser ser Val Thr Pro Leu Gly Ser Trp Val Leu Leu His His 
15 10 15 

cat cct tea act ate tta acc caa tec aga tec aga tct cct cct tct 
His pro ser Thr lie Leu Thr Gin ser Arg Ser Arg Ser Pro Pro Ser 
20 25 30 

etc ate acc ctt aaa ccc ate tec etc act cca aaa cgc acc gtt teg 
Leu lie Thr Leu Lys Pro lie Ser Leu Thr Pro Lys Arg Thr Val ser 
35 40 45 

tct tct tec tec tct tec etc ate acc aaa gaa gac aac aac etc aaa 
ser ser ser Ser Ser Ser Leu lie Thr Lys Glu Asp Asn Asn Leu Lys 
50 55 60 

tec tct tec tct tec ttc gat ttc atg tct tac ate ate cgc aaa gee 
Ser Ser ser Ser ser Phe Asp Phe Met Ser Tyr lie lie Arg Lys Ala 
65 70 75 80 

gac tec gtc aac aaa gee tta gac tec gee gtc cct etc egg gag cca 
sp Ser Val Asn Lys Ala Leu Asp Ser Ala val Pro Leu Arg Glu pro 
85 90 95 

__c aag ate cac gaa gcg atg cgt tac tct etc etc gee gga gga aaa 
Leu Lys lie His Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys 
100 105 110 

cgc gtc aga cca gtt etc tgc ate gee gcg tgc gag eta gtc gqa gqa 
Arg val Arg Pro val Leu Cys lie Ala Ala Cys Glu Leu val Gly Gly 
115 120 125 

gaa gag tct tta get atg ccg gcg cgt tgc gee gtg gaa atg ate cac 
Glu Glu ser Leu Ala Met Pro Ala Arg cys Ala Val Glu Met lie His 
130 135 " " 140 

acc atg teg ttg ate cac gac gac ttg cct tgt atg gat aac gac gat 
Thr Met Ser Leu lie His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp 
145 150 155 160 

etc cgc cgc gqa aag ccc acg aat cac aaa gtt tac ggc gaa gac gtg 
Leu Arg Arg Gly Lys Pro Thr Asn His Lys val Tyr Gly Glu Asp val 
165 170 175 

eg gtt tta gee gga gac gcg ctt ctt teg ttc gee ttc gag cat tta 
fla Val Leu Ala Gly Asp Ala Leu Leu ser Phe Ala Phe Glu His Leu 
180 185 190 




gcg teg get acg age teg gag gtt tct ccg gcg aga gtg gtt aga get 
Ala Ser Ala Thr ser ser Glu val Ser Pro Ala Arg Val Val Arg Ala 
195 200 205 

gtg gga gag ttg get aaa gee ate ggc acc gaa ggg etc gtg gcg gga 
Val Gly Glu Leu Ala Lys Ala lie Gly Thr Glu Gly Leu val Ala Gly 
210 215 220 

caa gtg gtg gat ata age agt gaa ggg ttg gac tta aac aac gtc gga 
Gin Val Val Asp lie Ser Ser Glu Gly Leu Asp Leu Asn Asn val Gly 
225 230 235 240 

ttg gag cat ttg aag ttt ata cat ttg cat aaa acg gcg gcg ttg ctt 
Leu Glu His Leu Lys Phe lie His Leu His Lys Thr Ala Ala Leu Leu 
245 250 255 

gaa get tea gcg gtt ttg ggt ggg ate ate ggt gga ggg agt gat gaa 
Glu Ala Ser Ala val Leu Gly Gly lie lie Gly Gly Gly ser Asp Glu 
260 265 270 
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gag ate gag agg ctg agg aag ttc gcg agg tgt att gqg ttg ttg ttt 
Glu lie Glu Arg Leu Arg Lys Phe Ala Arg cys He Gly Leu Leu Phe 
275 280 285 



aca gag gca cgt gat cag ctt tta gqg ttt gat tec gac aag gtt get 
Thr Glu Ala Arg Asp Gin Leu Leu Gly Phe Asp ser Asp Lys Val Ala 
340 345 350 



<210> 


68 


<211> 


366 


<212> 


PRT 


<213> 


Si nabs alba 


<400> 


68 



Met Ala ser ser val Thr Pro Leu Gly Ser Trp Val Leu Leu His His 
1 5 10 15 



His Pro Ser Thr lie Leu Thr Gin Ser Arg ser Arg ser Pro Pro ser 
20 25 30 



u lie Thr Leu Lys Pro lie ser Leu Thr Pro Lys Arg Thr val Ser 
35 40 45 



ser Ser Ser ser Ser ser Leu lie Thr Lys Glu Asp Asn Asn Leu Lys 
50 55 60 

Ser Ser Ser Ser Ser Phe Asp Phe Met ser Tyr lie lie Arg Lys Ala 
65 70 75 80 

Asp Ser val Asn Lys Ala Leu Asp Ser Ala val Pro Leu Arg Glu Pro 
85 90 95 

Leu Lys lie His Glu Ala Met Arg Tyr ser Leu Leu Ala Gly Gly Lys 
100 105 110 

Arg Val Arg Pro Val Leu cys lie Ala Ala cys Glu Leu Val Gly Gly 
115 120 125 

Seite 103 



864 



912 



cag gtq gtt gat gat ate ttg gac gtq acg aaa teg tct caa gaa ctg 

Gin val val Asp Asp lie Leu Asp Val Thr Lys Ser ser Gin Glu Leu 

290 295 300 

gqg aaa ace get gqg aaa gat ttg att get gat aag ttg act tat ccg 960 

Gly Lys Thr Ala Gly Lys Asp Leu He Ala Asp Lys Leu Thr Tyr Pro 

305 310 315 320 

aag etc atg got ttg gag aaa teg aga gag ttc get gag aag ttg aat 1008 

Lys Leu Met Gly Leu Glu Lys ser Arg Glu Phe Ala Glu Lys Leu Asn 

325 330 335 



1056 



cct ttg ttg get ttg get aat tac att gee aat aga cag aac tga 1101 
~ro Leu Leu Ala Leu Ala Asn Tyr lie Ala Asn Arg Gin Asn 
355 360 365 



04sequ.txt 

Glu Glu Ser Leu Ala Met Pro Ala Arg Cys Ala Val Glu Met lie His 
130 135 140 

Thr Met Ser Leu lie His Asp Asp Leu Pro cys Met Asp Asn Asp Asp 
145 150 155 160 



Leu Arg Arg Gly Lys Pro Thr Asn His Lys val Tyr Gly Glu Asp val 

170 ~~ 



165 



175 



Ala val Leu Ala Gly Asp Ala Leu Leu Ser Phe Ala Phe Glu His Leu 

180 185 190 

Ala ser Ala Thr ser ser Glu val Ser Pro Ala Arg val Val Arg Ala 
195 200 205 



al Gly Glu Leu Ala Lys Ala He Gly Thr Glu Gly Leu Val Ala Gly 
* 210 215 220 



Gin val Val Asp lie Ser ser Glu Gly Leu Asp Leu Asn Asn Val Gly 
225 230 235 240 



Leu Glu His Leu Lys Phe lie His Leu His Lys Thr Ala Ala Leu Leu 
245 250 255 

Glu Ala ser Ala val Leu Gly Gly He lie Gly Gly Gly ser Asp Glu 
260 265 270 

Glu lie Glu Arg Leu Arg Lys Phe Ala Arg Cys lie Gly Leu Leu Phe 
275 280 285 

Gin Val val Asp Asp lie Leu Asp val Thr Lys ser Ser Gin Glu Leu 
290 295 300 



• 



[ly Lys Thr Ala Gly Lys Asp Leu lie Ala Asp Lys Leu Thr Tyr Pro 
5 310 315 320 



Lys Leu Met Gly Leu Glu Lys ser Arg Glu Phe Ala Glu Lys Leu Asn 
325 330 335 

Thr Glu Ala Arg Asp Gin Leu Leu Gly Phe Asp Ser Asp Lys Val Ala 
340 345 350 

Pro Leu Leu Ala Leu Ala Asn Tyr lie Ala Asn Arg Gin Asn 
355 360 365 



<210> 69 
<211> 930 
<212> DNA 
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<213> Erwinia uredovora 



<220> 

<221> CDS 

<222> (1) . . (930) 

<223> 



<400> 69 

atg aat aat ccg teg tta etc aat cat gcg gtc gaa acg atg gca gtt 48 

Met Asn Asn Pro ser Leu Leu Asn His Ala Val Glu Thr Met Ala val 
15 10 15 

ggc teg aaa agt ttt gcg aca gee tea aag tta ttt gat gca aaa acc 96 

Gly Ser Lys ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr 
20 25 30 



cgc age gta ctg atg etc tac gee tgg tgc cgc cat tgt gac gat 144 
Arg ser val Leu Met Leu Tyr Ala Trp cys Arg His Cys Asp Asp 
35 40 45 




gtt att gac gat cag acg ctg ggc ttt cag gec egg cag cct gee tta 192 

val lie Asp Asp Gin Thr Leu Gly Phe Gin Ala Arg Gin Pro Ala Leu 

50 55 60 

caa acg ccc gaa caa cgt ctg atg caa ctt gag atg aaa acg cgc cag 240 

Gin Thr Pro Glu Gin Arg Leu Met Gin Leu Glu Met Lys Thr Arg Gin 

65 70 75 80 

gee tat gca gqa teg cag atg cac gaa ccg gcg ttt gcg get ttt cag 288 

Ala Tyr Ala Gly ser Gin Met His Glu Pro Ala Phe Ala Ala Phe Gin 

85 90 95 

gaa gtg get atg get cat gat ate gec ccg get tac gcg ttt gat cat 336 

Glu Val Ala Met Ala His Asp lie Ala Pro Ala Tyr Ala Phe Asp His 

100 105 110 

ctg gaa ggc ttc gec atg gat gta cgc gaa gcg caa tac age caa ctg 384 

Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gin Tyr ser Gin Leu 

115 120 125 



t gat acg ctg cgc tat tgc tat cac gtt gca ggc gtt gtc ggc ttg 
p Asp Thr Leu Arg Tyr Cys Tyr His val Ala Gly val val Gly Leu 
130 135 140 



gee tgt gac ctt gqg ctg gca ttt cag ttg acc aat att get cgc gat 
Ala Cys Asp Leu Gly Leu Ala Phe Gin Leu Thr Asn lie Ala Arg Asp 
165 170 175 



432 



atg atg gcg caa ate atg ggc gtg egg gat aac gee acg ctg gac cgc ■ 480 
Met Met Ala Gin lie Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg 
145 150 155 160 



528 



att gtg gac gat gcg cat gcg ggc cgc tgt tat ctg ccg gca age tgg 576 

lie val Asp Asp Ala His Ala Gly Arg cys Tyr Leu Pro Ala Ser Trp 

180 185 190 

ctg gag cat gaa ggt ctg aac aaa gag aat tat gcg gca cct gaa aac 624 

Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala Pro Glu Asn 

195 200 205 

cgt cag gcg ctg age cgt ate gec cgt cgt ttg gtg cag gaa gca gaa 672 
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Arg Gin Ala Leu Ser Arg lie Ala Arg Arg Leu Val Gin Glu Ala Glu 
210 215 220 

cct tac tat ttg tct gcc aca gcc gqc ctg gca ggg ttg ccc ctg cgt 

pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala Gly Leu Pro Leu Arg 

225 230 235 240 



tec gcc tgg gca ate get acg gcg aag cag gtt tac egg aaa ata ggt 
Ser Ala Trp Ala lie Ala Thr Ala Lys Gin val Tyr Arg Lys He Gly 
245 250 255 

gtc aaa gtt gaa cag gcc ggt cag caa gcc tgg gat cag egg cag tea 
val Lys Val Glu Gin Ala Gly Gin Gin Ala Trp Asp Gin Arg Gin Ser 
260 265 270 

acg ace acg ccc gaa aaa tta acg ctg ctg ctg gcc gcc tct ggt cag 
Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala Ser Gly Gin 
275 280 285 

gcc ctt act tec egg atg egg get cat cct ccc cgc cct gcg cat etc 912 
Ala Leu Thr Ser Arg Met Arg Ala His Pro Pro Arg Pro Ala His Leu 
290 ~ 295 300 




cag cgc ccg etc tag 
Gin Arg Pro Leu 



<210> 70 
<211> 309 
<212> PRT 

<213> Erwinia uredovora 
<400> 70 

Met Asn Asn Pro ser Leu Leu Asn His Ala Val Glu Thr Met Ala Val 
15 10 15 

Gly Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr 
20 25 30 

g Arg ser Val Leu Met Leu Tyr Ala Trp cys Arg His Cys Asp Asp 
35 40 .45 

Val lie Asp Asp Gin Thr Leu Gly Phe Gin Ala Arg Gin Pro Ala Leu 
50 55 60 

Gin Thr Pro Glu Gin Arg Leu Met Gin Leu Glu Met Lys Thr Arg Gin 
65 70 75 80 

Ala Tyr Ala Gly Ser Gin Met His Glu Pro Ala Phe Ala Ala Phe Gin 
85 90 95 

Glu val Ala Met Ala His Asp lie Ala Pro Ala Tyr Ala Phe Asp His 
100 105 110 




720 



768 



816 



864 



930 
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Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gin Tyr Ser Gin Leu 
115 120 125 

Asp Asp Thr Leu Arg Tyr cys Tyr His Val Ala Gly val val Gly Leu 
H 130 135 140 

Met Met Ala Gin lie Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg 
145 150 155 160 

Ala cys Asp Leu Gly Leu Ala Phe Gin Leu Thr Asn lie Ala Arg Asp 
165 170 175 

lie Val Asp Asp Ala His Ala Gly Arg cys Tyr Leu Pro Ala Ser Trp 
180 185 190 

Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala Pro Glu Asn 
195 200 205 



Gin Ala Leu ser Arg lie Ala Arg Arg Leu Val Gin Glu Ala Glu 
210 215 ~ 220 




Pro Tyr Tyr Leu ser Ala Thr Ala Gly Leu Ala Gly Leu Pro Leu Arg 
225 230 235 240 

Ser Ala Trp Ala lie Ala Thr Ala Lys Gin val Tyr Arg Lys lie Gly 
245 250 255 

Val Lys Val Glu Gin Ala Gly Gin Gin Ala Trp Asp Gin Arg Gin Ser 
260 265 270 

Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala Ser Gly Gin 
275 280 285 

Ala Leu Thr ser Arg Met Arg Ala His Pro pro Arg pro Ala His Leu 
290 295 300 

Gin Arg Pro Leu 

305 

<210> 71 
<211> 1479 
<212> DNA 

<213> Erwinia uredovora 



<220> 

<221> CDS 

<222> (1) . . (1479) 
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<223> 



<400> 71 



atg aaa cca act acg gta att gqt gca gqc ttc ggt gqc ctg gca ctg 
Met Lys Pro Thr Thr Val lie Gly Ala Gly Phe Gly Gly Leu Ala Leu 
1 5 10 15 

gca att cgt eta caa get gcg gqg ate ccc gtc tta ctg ctt gaa caa 
Ala lie Arg Leu Gin Ala Ala Gly lie Pro val Leu Leu Leu Glu Gin 
20 25 30 

cgt gat aaa ccc gqc gqt egg get tat gtc tac gag gat cag gqg ttt 
Arg Asp Lys Pro Gly Gly Arg Ala Tyr val Tyr Glu Asp Gin Gly Phe 
35 40 45 

acc ttt gat gca gqc ccg acg gtt ate acc gat ccc agt gee att gaa 
Thr Phe Asp Ala Gly Pro Thr Val lie Thr Asp Pro Ser Ala lie Glu 
50 55 60 



gaa ctg ttt gca ctg gca gqa aaa cag tta aaa gag tat gtc gaa ctg 
lu Leu Phe Ala Leu Ala Gly Lys Gin Leu Lys Glu Tyr val Glu Leu 

70 75 80 




^ g ccg gtt acg ccg ttt tac cgc ctg tgt tgg gag tea gqg aag gtc 
Leu Pro val Thr Pro Phe Tyr Arg Leu cys Trp Glu Ser Gly Lys Val 
85 90 95 

ttt aat tac gat aac gat caa acc egg etc gaa gcg cag att cag cag 
Phe Asn Tyr Asp Asn Asp Gin Thr Arg Leu Glu Ala Gin lie Gin Gin 
100 105 110 

ttt aat ccc cgc gat gtc gaa gqt tat cgt cag ttt ctg gac tat tea 
Phe Asn Pro Arg Asp val Glu Gly Tyr Arg Gin Phe Leu Asp Tyr Ser 
115 120 ~ 125 

cgc gcg gtq ttt aaa gaa gqc tat eta aag etc gqt act gtc cct ttt 
Arg Ala val Phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr Val Pro Phe 
130 135 ~ 140 

tta teg ttc aga gac atg ctt cgc gee gca cct caa ctg gcg aaa ctg 
Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gin Leu Ala Lys Leu 
145 ~ 150 155 160 

£ag gca tgg aga age gtt tac agt aag gtt gee agt tac ate gaa gat 
"n Ala Trp Arg ser Val Tyr Ser Lys Val Ala ser Tyr lie Glu Asp 
165 170 175 



gaa cat ctg cgc cag gcg ttt tct ttc cac teg ctg ttg gtq gqc gqc 
His Leu Arg Gin Ala Phe Ser Phe His Ser Leu Leu val Gly Gly 
180 185 190 



aat ccc ttc gee acc tea tec att tat acg ttg ata cac gcg ctg gag 

Asn Pro Phe Ala Thr ser ser lie Tyr Thr Leu lie His Ala Leu Glu 
195 200 205 

cgt gag tgg gqc gtc tgg ttt ccg cgt gqc gqc acc gqc gca tta gtt 

Arg Glu Trp Gly Val Trp Phe Pro Arg Gly Gly Thr Gly Ala Leu Val 
210 215 ~ 220 

cag gqg atg ata aag ctg ttt cag gat ctg gqt gqc gaa gtc gtq tta 

Gin Gly Met lie Lys Leu Phe Gin Asp Leu Gly Gly Glu Val Val Leu 

225 230 235 240 

aac gee aga gtc age cat atg gaa acg aca gqa aac aag att gaa gee 

Asn Ala Arg Val Ser His Met Glu Thr Thr Gly Asn Lys lie Glu Ala 

245 250 255 
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gtg cat tta gag gac ggt cgc agg ttc ctg acg caa gcc gtc gcg tea 
VaT His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gin Ala val Ala Ser 
260 265 270 

aat gca gat gtg gtt cat acc tat cgc gac ctg tta age cag cac cct 
Asn Ala Asp val val His Thr Tyr Arg Asp Leu Leu Ser Gin His Pro 
275 280 285 

gcc gcg gtt aag cag tec aac aaa ctg cag act aag cgc atg agt aac 
Ala Ala Val Lys Gin Ser Asn Lys Leu Gin Thr Lys Arg Met ser Asn 
290 295 300 

tct ctg ttt gtg etc tat ttt ggt ttg aat cac cat cat gat cag etc 
Ser Leu Phe val Leu Tyr Phe Gly Leu Asn His His His Asp Gin Leu 
305 310 315 320 

gcg cat cac acg gtt tgt ttc ggc ccg cgt tac cgc gag ctg att gac 
Ala His His Thr Val Cys Phe Gly Pro Arg Tyr Arg Glu Leu lie Asp 
325 330 335 

gaa att ttt aat cat gat ggc etc gca gag gac ttc tea ctt tat ctg 
Glu lie Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu 
340 345 350 



• 

^Tns 



w __ gcg ccc tgt gtc acg gat teg tea ctg gcg cct gaa gqt tgc ggc 
is Ala Pro Cys Val Thr Asp Ser ser Leu Ala Pro Glu Gly Cys Gly 
355 360 365 

agt tac tat gtg ttg gcg ccg gtg ccg cat tta ggc acc gcg aac etc 
Ser Tyr Tyr Val Leu Ala Pro val Pro His Leu Gly Thr Ala Asn Leu 
370 375 380 

gac tgg acg gtt gag ggg cca aaa eta cgc gac cgt att ttt gcg tac 
Asp Trp Thr val Glu Gly Pro Lys Leu Arg Asp Arg lie Phe Ala Tyr 
385 390 395 400 

ctt gag cag cat tac atg cct ggc tta egg agt cag ctg gtc acg cac 
Leu Glu Gin His Tyr Met Pro Gly Leu Arg Ser Gin Leu Val Thr His 
405 410 415 

egg atg ttt acg ccg ttt gat ttt cgc gac cag ctt aat gcc tat cat 
Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gin Leu Asn Ala Tyr His 
420 425 430 



c tea gcc ttt tct gtg gag ccc gtt ctt acc cag age gcc tgg ttt 
y Ser Ala Phe Ser val Glu Pro val Leu Thr Gin ser Ala Trp Phe 
435 440 445 



egg ccg cat aac cgc gat aaa acc att act aat etc tac ctg gtc ggc 
Arg Pro His Asn Arg Asp Lys Thr lie Thr Asn Leu Tyr Leu Val Gly 
450 455 460 

gca ggc acg cat ccc ggc gca ggc att cct ggc gtc ate ggc teg gca 
Ala Gly Thr His Pro Gly Ala Gly lie Pro Gly val lie Gly Ser Ala 
465 470 475 480 

aaa gcg aca gca ggt ttg atg ctg gag gat ctg ata tga 
Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu lie 
485 490 

<210> 72 
<211> 492 
<212> PRT 

Seite 109 



<213> Erwinia uredovora 



04sequ.txt 



<400> 72 

Met Lys Pro Thr Thr Val lie Gly Ala Gly Phe Gly Gly Leu Ala Leu 
15 10 15 

Ala He Arg Leu Gin Ala Ala Gly lie Pro val Leu Leu Leu Glu Gin 
20 25 30 

Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr Glu Asp Gin Gly Phe 
35 40 45 

Thr Phe Asp Ala Gly Pro Thr Val lie Thr Asp Pro Ser Ala lie Glu 
50 55 60 



lu Leu Phe Ala Leu Ala Gly Lys Gin Leu Lys Glu Tyr Val Glu Leu 

70 75 80 



Leu Pro Val Thr Pro Phe Tyr Arg Leu cys Trp Glu Ser Gly Lys Val 
85 ~ 90 95 




Phe Asn Tyr Asp Asn Asp Gin Thr Arg Leu Glu Ala Gin lie Gin Gin 
100 105 110 

Phe Asn Pro Arg Asp Val Glu* Gly Tyr Arg Gin Phe Leu Asp Tyr ser 
115 120 125 

Arg Ala Val Phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr val Pro Phe 
130 135 140 

Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gin Leu Ala Lys Leu 
145 150 155 160 



n Ala Trp Arg ser val Tyr ser Lys val Ala Ser Tyr lie Glu Asp 
165 170 175 



Glu His Leu Arg Gin Ala Phe Ser Phe His Ser Leu Leu val Gly Gly 
180 185 190 

Asn Pro Phe Ala Thr ser ser lie Tyr Thr Leu lie His Ala Leu Glu 
195 200 205 

Arg Glu Trp Gly val Trp Phe Pro Arg Gly Gly Thr Gly Ala Leu Val 
y 210 215 220 

Gin Gly Met lie Lys Leu Phe Gin Asp Leu Gly Gly Glu val val Leu 
225 230 235 240 



Asn Ala Arg val ser His Met Glu Thr Thr Gly Asn Lys lie Glu Ala 
245 250 255 
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val His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gin Ala Val Ala Ser 
260 ~ 265 270 

Asn Ala Asp val val HisThr Tyr Arg Asp Leu Leu ser Gin His Pro 
275 280 285 

Ala Ala val Lys Gin Ser Asn Lys Leu Gin Thr Lys Arg Met ser Asn 
290 295 300 

Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His His His Asp Gin Leu 
305 310 315 320 

Ala His His Thr val cys Phe Gly Pro Arg Tyr Arg Glu Leu lie Asp 
325 330 335 



"lu lie Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu 
340 345 350 



His Ala Pro Cys val Thr Asp ser ser Leu Ala Pro Glu Gly cys Gly 
355 360 365 




Ser Tyr Tyr val Leu Ala Pro val Pro His Leu Gly Thr Ala Asn Leu 
370 375 380 

Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp Arg lie Phe Ala Tyr 
385 390 395 400 

Leu Glu Gin His Tyr Met Pro Gly Leu Arg ser Gin Leu val Thr His 
405 410 415 

Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gin Leu Asn Ala Tyr His 
420 425 430 



y Ser Ala Phe ser Val Glu Pro val Leu Thr Gin Ser Ala Trp Phe 
435 440 445 



Arg Pro His Asn Arg Asp Lys Thr lie Thr Asn Leu Tyr Leu val Gly 
450 455 460 

Ala Gly Thr His Pro Gly Ala Gly lie Pro Gly val He Gly Ser Ala 
465 470 475 480 

Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu lie 
485 490 



<210> 73 
<211> 1725 
<212> DNA 
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<213> Narcissus pseudonarci ssus 



<220> 

<221> CDS 

<222> (D.-C1725) 

<223> 



atq act tct tec act tgt tta att cat tct tec tct ttt ggg gtt gga 
Met Ala ser Ser Thr Cys Leu He His Ser Ser Ser Phe Gly val Gly 
15 10 15 

qqa aag aaa gtg aag atg aac acg atg att cga teg aag ttg ttt tea 
Glv Lvs Lys Val Lys Met Asn Thr Met lie Arg Ser Lys Leu Phe ser 
y y 20 25 30 



t 




cqq teg get ttg gac act aag gtg tct gat atg age gtc aat get 
Arg ser Ala Leu Asp Thr Lys Val Ser Asp Met ser Val Asn Ala 
35 40 45 

cca aaa gga ttg ttt cca cca gag cct gag cac tac agg ggg cca aag 
pro Lvs Gly Leu Phe Pro Pro Glu Pro Glu His Tyr Arg Gly Pro Lys 
50 55 60 

ctt aaa gtg get ate att gga get ggg etc get ggc atg tea act gca 
Leu Lys val Ala lie lie Gly Ala Gly Leu Ala Gly Met ser Thr Ala 
65 70 75 80 

qtq gag ctt ttg gat caa ggg cat gag gtt gac ata tat gaa tec aga 
val Glu Leu Leu Asp Gin Gly His Glu Val Asp lie Tyr Glu ser Arg 
85 90 95 




caa ttt att ggt ggt aaa gtc ggt tct ttt gta gat aag cgt gga aac 
Gin Phe He Gly Gly Lys val Gly ser Phe val Asp Lys Arg Gly Asn 
100 105 110 

cat att gaa atg gga etc cat gtg ttt ttt ggt tgc tat aac aat ctt 
His lie Glu Met Gly Leu His val Phe Phe Gly Cys Tyr Asn Asn Leu 
115 120 125 

c aga ctt atg aaa aag gta ggt gca gat gaa aat tta ctg gtg aag 
e Arg Leu Met Lys Lys Val Gly Ala Asp Glu Asn Leu Leu Val Lys 
130 135 140 

gat cat act cat ace ttt gta aac cga ggt gga gaa att ggt gaa ctt 
Asp His Thr His Thr Phe Val Asn Arg Gly Gly Glu He Gly Glu Leu 
145 150 155 160 

gat ttc cga ctt ccg atg ggt gca cca tta cat ggt. att cgt gca ttt 
Asp Phe Arg Leu Pro Met Gly Ala Pro Leu His Gly lie Arg Ala Phe 
165 170 175 



aca act aat caa ctg aag cct tat gat aaa gca agg aat get gtg 
Thr Thr Asn Gin Leu Lys Pro Tyr Asp Lys Ala Arg Asn Ala Val 



eta 

Leu — lag • - " 190 



48 



96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



get ctt gee ctt age cca gtt gta cgt get ctt att gat cca aat ggt 
Ala Leu Ala Leu Ser Pro val val Arg Ala Leu lie Asp Pro Asn Gly 
195 200 205 

gca atg cag gat ata agg aac tta gat aat att age ttt tct gat tgg 672 
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Ala Met Gin Asp He Arg Asn Leu Asp Asn lie Ser Phe Ser Asp Trp 
210 215 220 

ttc tta tec aaa ggc ggt acc cgc atg age ate caa agg atg tgg gat 720 
Phe Leu ser Lys Gly Gly Thr Arg Met Ser lie Gin Arg Met Trp Asp 
225 230 235 240 

cca gtt get tat gee etc gga ttt att gac tgt gat aat ate agt gee 768 
Pro Val Ala Tyr Ala Leu Gly Phe lie Asp Cys Asp Asn lie ser Ala 
245 250 255 

cgt tgt atg ctt act ata ttt tct eta ttt get act aag aca gaa get 816 
Arg cys Met Leu Thr lie Phe ser Leu Phe Ala Thr Lys Thr Glu Ala 
260 265 270 

tct ctg ttg cgt atg ttg aag ggt teg cct gat gtt tac tta age ggt 864 
ser Leu Leu Arg Met Leu Lys Gly ser Pro Asp Val Tyr Leu ser Gly 
275 280 285 



cct ata aga aag tat att aca gat aaa ggt gga agg ttt cac eta agg 

Pro He Arg Lys Tyr lie Thr Asp Lys Gly Gly Arg Phe His Leu Arg 

290 295 300 

ggg tgt aga gag ata ctt tat gat gaa eta tea aat ggc gac aca 

Gly Cys Arg Glu lie Leu Tyr Asp Glu Leu ser Asn Gly Asp Thr 

310 315 320 




tgg gtg aca gag atg caa gat ctg gaa aaa tea agg cag ttg aga get 
Trp Val Thr Glu Met Gin Asp Leu Glu Lys Ser Arg Gin Leu Arg Ala 
385 390 395 400 



912 



960 



tat ate aca ggc att gca atg teg aag get acc aat aaa aaa ctt gtg 1008 
Tyr lie Thr Gly lie Ala Met Ser Lys Ala Thr Asn Lys Lys Leu Val 
325 330 335 

aaa get gac gtg tat gtt gca gca tgt gat gtt cct gga ata aaa agg 1056 
Lys Ala Asp Val Tyr Val Ala Ala Cys Asp val Pro Gly lie Lys Arg 
340 345 350 

ttg ate cca teg gag tgg aga gaa tgg gat eta ttt gac aat ate tat 1104 
Leu lie Pro ser Glu Trp Arg Glu Trp Asp Leu Phe Asp Asn lie Tyr 
355 360 365 

aaa eta gtt gga gtt cca gtt gtc act gtt cag ctt agg tac aat ggt 1152 
Lys Leu Val Gly Val Pro val val Thr Val Gin Leu Arg Tyr Asn Gly 
370 375 380 



1200 



gta gga ttg gat aat ctt ctt tat act cca gat gca gac ttt tct 1248 
a val Gly Leu Asp Asn Leu Leu Tyr Thr Pro Asp Ala Asp Phe Ser 
405 410 415 

tgt ttt tct gat ctt gca etc teg teg cct gaa gat tat tat att gaa 1296 
cys Phe Ser Asp Leu Ala Leu Ser ser Pro Glu Asp Tyr Tyr lie Glu 
420 425 430 

gga caa ggg tec eta ata cag get gtt etc acg cca ggg gat cca tac 1344 
Gly Gin Gly ser Leu lie Gin Ala val Leu Thr Pro Gly Asp Pro Tyr 
435 440 445 

atg ccc eta cct aat gat gca att ata gaa aga gtt egg aaa cag gtt 1392 
Met Pro Leu Pro Asn Asp Ala lie He Glu Arg val Arg Lys Gin Val 
450 455 460 

ttg gat tta ttc cca tec tct caa ggc ctg gaa gtt eta tgg tct teg 1440 
Leu Asp Leu Phe Pro Ser ser Gin Gly Leu Glu val Leu Trp Ser Ser 
465 470 475 480 

gtg gtt aaa ate gga caa tec eta tat egg gag ggg cct gga aag gac 1488 
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Val val Lys lie Gly Gin ser Leu Tyr Arg Glu Gly Pro Gly Lys Asp 
485 490 495 

cca ttc aga cct gat cag aag aca cca gta aaa aat ttc ttc ctt gca 1536 
Pro Phe Arg Pro Asp Gin Lys Thr Pro Val Lys Asn Phe Phe Leu Ala 
500 505 510 



ggt tea tac acc aaa cag gat tac att gac agt atg gaa gga gcg acc 
Gly Ser Tyr Thr Lys Gin Asp Tyr lie Asp Ser Met Glu Gly Ala Thr 
515 520 525 




0> 74 
<211> 574 
<212> PRT 

<213> Narcissus pseudonarcissus 
<400> 74 

Met Ala ser Ser Thr Cys Leu lie His ser ser ser Phe Gly Val Gly 
15 10 15 

Gly Lys Lys val Lys Met Asn Thr Met lie Arg ser Lys Leu Phe ser 
20 25 30 

lie Arg ser Ala Leu Asp Thr Lys val Ser Asp Met Ser val Asn Ala 
35 40 45 

o Lys Gly Leu Phe Pro Pro Glu Pro Glu His Tyr Arg Gly Pro Lys 
50 55 60 

Leu Lys Val Ala lie lie Gly Ala Gly Leu Ala Gly Met Ser Thr Ala 
65 70 75 80 

Val Glu Leu Leu Asp Gin Gly His Glu val Asp lie Tyr Glu ser Arg 
85 90 95 

Gin Phe lie Gly Gly Lys val Gly Ser Phe val Asp Lys Arg Gly Asn 
100 105 110 

His lie Glu Met Gly Leu His Val Phe Phe Gly Cys Tyr Asn Asn Leu 
115 120 125 



seite 114 



1584 



eta teg ggg aga caa gca get gca tat ate tgc age gee ggt gaa gat 1632 
Leu Ser Gly Arg Gin Ala Ala Ala Tyr lie cys ser Ala Gly Glu Asp 
530 535 540 

ctg gca gca ctt cgc aag aag ate get get gat cat cca gag caa ctg 1680 
Leu Ala Ala Leu Arg Lys Lys lie Ala Ala Asp His Pro Glu Gin Leu 
545 550 555 560 

ate aac aaa gat tct aac gtg teg gat gaa ctg agt etc gta taa 1725 
lie Asn Lys Asp ser Asn val ser Asp Glu Leu Ser Leu val 
565 570 



04sequ.txt 

Phe Arg Leu Met Lys Lys Val Gly Ala Asp Glu Asn Leu Leu Val Lys 
130 135 140 

Asp His Thr His Thr Phe val Asn Arg Gly Gly Glu lie Gly Glu Leu 
145 • 150 155 160 

Asp Phe Arg Leu Pro Met Gly Ala Pro Leu His Gly lie Arg Ala Phe 

Leu Thr Thr Asn Gin Leu Lys Pro Tyr Asp Lys Ala Arg Asn Ala Val 
180 185 190 

Ala Leu Ala Leu ser Pro Val Val Arg Ala Leu lie Asp Pro Asn Gly 
195 200 205 

Ala Met Gin Asp lie Arg Asn Leu Asp Asn lie Ser Phe ser Asp Trp 
210 215 220 



Leu ser Lys Gly Gly Thr Arg Met ser lie Gin Arg Met Trp Asp 
230 235 240 



Pro Val Ala Tyr Ala Leu Gly Phe lie Asp cys Asp Asn He Ser Ala 
245 250 255 

Arq cys Met Leu Thr lie Phe Ser Leu Phe Ala Thr Lys Thr Glu Ala 
a y 260 265 270 

ser Leu Leu Arg Met Leu Lys Gly Ser Pro Asp Val Tyr Leu ser Gly 
275 280 285 

pro lie Arg Lys Tyr lie Thr Asp Lys Gly Gly Arg Phe His Leu Arg 
290 295 300 



Trp Gly cys Arg Glu He Leu Tyr Asp Glu Leu ser Asn Gly Asp Thr 
-05 " 310 315 320 



r lie Thr Gly lie Ala Met Ser Lys Ala Thr Asn Lys Lys Leu Val 
325 330 335 



Lys Ala Asp val Tyr val Ala Ala cys Asp val Pro Gly He Lys Arg 
340 345 350 

Leu lie Pro ser Glu Trp Arg Glu Trp Asp Leu Phe Asp Asn lie Tyr 
355 360 365 

Lys Leu val Gly val pro val val Thr val Gin Leu Arg Tyr Asn Gly 
370 375 380 

Trp val Thr Glu Met Gin Asp Leu Glu Lys ser Arg Gin Leu Arg Ala 
385 390 395 400 
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Ala Val Gly Leu As ? Asn Leu Leu Tyr Thr Pro Asp Ala Asp Phe Sen 

cys Phe ser Asp Leu Ala Leu ser ser Pro Glu Asp Tyr Tyr He Glu 

Gly Gin Gl^ ser Leu He Gin Ala val Leu Thr Pro Glv Asp Pro Tyr 

Met Pro Leu Pro Asn Asp Ala He He Glu Arg Val Arg Lys Gin val 
450 455 

Leu Asp Leu Phe Pro ser ser Gin Gly Leu Glu val Leu Trp Ser ser 
465 470 

val val Lys He Gly Gin ser Leu Tyr Arg Glu Gly Pro Gly Lys Asp 

Phe Arg Pro Asp Gin Lys Thr. Pro Val Lys Asn Phe Phe Leu Ala 
500 505 

Gly ser Tyr Thr Lys Gin Asp Tyr He Asp ser Met Glu Gly Ala Thr 
515 5Z0 

Leu ser Gly Arg Gin Ala Ala Ala Tyr He cys ser Ala Gly Glu Asp 
530 535 3 

Leu Ala Ala Leu Arg Lys Lys lie Ala Ala Asp His Pro Glu Gin Leu 
545 550 5 

lie Asn Lys Asp Ser Asn val ser Asp Glu Leu Ser Leu val 
565 - >/u 

<210> 75 
11> 1848 
12> DNA 
<213> Lycopersicon esculentum 



<220> 

<221> CDS 

<222> (1) - - C1848) 

<223> 

i nib III IS SI S3 SS S S 2 2S £ f ^ 

1 5 xu 
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tac aaa act qta get ttg ggt gat age aaa cca aga tac aat aaa cag 96 

• cys 5s Thr val Ala Leu cTy Asp ser Lys Pro Arg Tyr Asn Lys Gin 
20 25 30 

aaa aat tct tat ttt gac cct ttg ata att gga aat tgt act gat cag 144 
Irl ser ser Cys Phe Asp Pro Leu He lie Gly Asn cys Thr Asp Gin 
35 40 45 

cag cag ctt tgt ggc ttg agt tgg gag gtg gac aag get aag gga aga 192 
Gin Gin Leu cys Gly Leu Ser Trp Gly Val Asp Lys Ala Lys Gly Arg 



50 55 60 

aqa ggg ggt act gtt tec aat ttg aaa gca gtt gta gat gta gac aaa 

Arg Gly Gly Thr val ser Asn Leu Lys Ala val Val Asp val Asp Lys 

70 75 80 



65 



aga gtg gag age tat ggc agt agt gat gta gaa gga aat gag agt ggc 
Arq val Glu Ser Tyr Gly ser ser Asp Val Glu Gly Asn Glu Ser Gly 
85 90 95 

age tat gat gee att gtt ata ggt tea gga ata ggt gga ttg gtg gca 
ser Tyr Asp Ala lie val lie Gly ser Gly He Gly Gly Leu Val Ala 
'Ik 100 105 110 

Wq acg cag ctg gcg gtt aag gga get aag gtt tta gtt ctg gag aag 
*i Thr Gin Leu Ala Val Lyi Gly Ala Lys val Leu val Leu Glu Lys 
115 120 125 

tat gtt att cct ggt gga age tct ggc ttt tac gag agg gat ggt tat 
Tyr val lie Pro Gly Gly Ser ser Gly Phe Tyr Glu Arg Asp Gly Tyr 
130 135 140 

aag ttt gat gtt ggt tea tea gtg atg ttt gga ttc agt gat aag gga 
Lyi Phe Asp val Gly ser ser Val Met Phe Gly Phe Ser Asp Lys Gly 
145 150 155 160 

aac etc aat tta att act caa gca ttg gca gca gta gga cgt aaa tta 
Asn Leu Asn Leu lie Thr Gin Ala Leu Ala Ala val Gly Arg Lys Leu 
165 170 175 

qaa gtt ata cct gac cca aca act gta cat ttc cac ctg cca aat gac 
Glu Val He Pro Asp Pro Thr Thr val His Phe His Leu Pro Asn Asp 
180 185 190 

I ctt tct gtt cgt ata cac cga gag tat gat gac ttc att gaa gag ctt 
feu Ser Val Arg lie His Arg Glu Tyr Asp Asp Phe lie Glu Glu Leu 
■ 195 200 205 

gtg agt aaa ttt cca cat gaa aag gaa ggg att ate aaa ttt tac agt 
val ser Lys Phe Pro His Glu Lys Glu Gly lie lie Lys Phe Tyr ser 
210 215 220 

qaa tgc tgg aag ate ttt aat tct ctg aat tea ttg gaa ctg aag tct 
Glu Cys Trp Lys lie Phe Asn Ser Leu Asn Ser Leu Glu Leu Lys ser 
225 230 235 240 

ttq qaq qaa ccc ate tac ctt ttt ggc cag ttc ttt aag aag ccc ctt 
Leu Glu Glu Pro He Tyr Leu Phe Gly Gin Phe Phe Lys Lys Pro Leu 
245 250 255 

gaa tgc ttg act ctt gee tac tat ttg ccc cag aat get ggt age ate 
Glu Cys Leu Thr Leu Ala Tyr Tyr Leu Pro Gin Asn Ala Gly Ser lie 
260 265 270 

get egg aag tat ata aga gat cct ggg ttg ctg tct ttt ata gat gca 
Ala Ara Lys Tyr lie Arg Asp Pro Gly Leu Leu ser Phe lie Asp Ala 
275 280 285 
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240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



04sequ.txt 

r,nn tnr fft ate ata aat aca gtt aat gca tta caa aca cca atg ate 912 
C?s Phe lie 8fi IS ?hr Sal Asn Ala Leu Gin Thr Pro Met He 
290 295 * UU 

SS R S SS 83 S SJ BS 1% SB SS H5 W "S S5 fg 

. 5 «a as w !H as as as as s ss s k ss i s 

325 330 3DD 

n . t na1 - cac aaa aat cag ata ctt tat agg gca aat gtt aca agt ate 
Isl Sp His l?y llr Gin He Leu Tyr Arg Ala Asn val Thr Ser He 



Asp Asp His GhJ Ser Gin lie ueu ^y;. «. y ~.. ^ 

ttn aac aat ggc aaa get gtg gga gtg aag ctt tct gac gag agg 
lie £2 Sp KS Gl£ Lys Ala va? Sly Va? Lys Leu ser Asp Gly Arg 
355 360 ao:> 

aan -t-tr tat act aaa acc ata gta teg aat get acc aga tgg gat act 
fyl Phe TV? Ala 5s Thr He Sal Ser Asn Ala Thr Arg Trp Asp Thr 
370 375 380 



^__ys 
^*lhe 



k gga aag ctt tta aaa get gag aat ctg cca aaa gaa gaa gaa aat 
iTy L ys Leu Leu Lys Ala Glu Asn Leu Pro Lys Glu Glu Glu Asn 
385 " 390 

t-t-r caa aaa act tat gta aaa gca cct tct ttt ctt tct att cat atg 
Phe Gin lys All Tyr val Lys Xla Pro ser Phe Leu ser He his Met 
405 410 

aaa att aaa gca gat gta etc cca cca gac aca gat tgt cac cat ttt 
Gly val Lys Ala Asp Val Leu Pro Pro Asp Thr Asp cys i His Phe 
420 425 *« u 

ate etc aaa gat gat tgg aca aat ttg gag aaa cca tat gga agt ata 
Sal lIu Glu Sp Asp Tr? Thr Asn Leu Glu Lys Pro Tyr cTy ser He 
435 440 

ttr tto aat a1 -t cca aca gtt ctt gat tec tea ttg gee cca gaa gga 
Phe 28 SS lie Pro Thr val Leu Asp Ser ser Leu Ala Pro Glu Gly 
450 455 460 

cac cat att ctt cac att ttt aca aca teg age att gaa gat tgg gag 

||s 5is lie iZ His lie Phe Thr Thr ser Ser He Glu Asp Trp Glu 
iaa etc tct ccg aaa gac tat gaa gcg aag aaa gag gtt gtt get gaa 
S ier Pro Lys Asp Tyr Glu Ala Lys Lys Glu Val val Ala Glu 




485 



ann att- ata aac aaa ctt gaa aaa aca etc ttc cca ggg ctt aag tea 
Jrg lie iS tlr Arg l2 Glu Lys Thr Leu Phe Pro Gly Leu Lys ser 
500 505 *xv 

+r+ an- rtr ttt aaa aaa qtq gga act cca aag acc cac aga cga tac 
tlr ?le Hu Phe Lyl g!2 fSH §ly Thr Pro Lys Thr His Arg Arg Tyr 
515 520 3" 

ctt get cgt gat agt ggt acc tat gga cca atg cca cgc gga aca cct 
feu Ala A?g Asp ser Gly Thr Tyr GTy Pro Met pro Arg cty Thr Pro 
530 535 540 

aaa aaa etc ctg gga atg cct ttc aat acc act get ata gat ggt eta 
Ss G?? 25 Leu Gly Met Pro Phe Asn Thr Thr Ala He Asp G?y Leu 
545 550 555 3W ' 
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960 



1008 



1056 



1104 

1152 

1200 

1248 

1296 

1344 

1392 

1440 

1488 

1536 

1584 

1632 

1680 



04sequ.txt 

Sf $ © as § ss ss ass ss p 0 as as §3 si xr. «a 
ss ss ss i S ss ss rs § ss ?3 s K f! ss as 
ss ffi m S s ss ss Eg bs ss ss ss ss ss ss ss 



595 



gat tag tta agg aca eta gca tga 
Gly Trp Leu Arg Thr Leu Ala 
610 615 



<210> 76 

<211> 615 

^:212> PRT 

3> Lycopersicon esculentum 



• 



<400> 76 

Met cys Thr Leu Ser Phe Met Tyr Pro Asn ser Leu Leu Asp Gly Thr 

1 5 10 

cys Lys Thr val Ala Leu Gly Asp S|r Lys Pro Arg Tyr Asn Lys Gin 



20 




Arg ser ser cys Phe Asp Pro Leu He lie Gly Asn cys Thr Asp Gin 
3 35 40 *" 

Gin Gin Leu cys Gly Leu ser Trp Gly Val Asp Lys Ala Lys Gly Arg 
50 55 

g Gly Gly Thr Val Ser Asn Leu Lys Ala val val Asp val Asp L^s 

Arg val Glu ser Tyr Gly Ser Ser Asp val Glu Gly Asn Glu Ser Gly 
85 90 

ser Tyr Asp Ala He val He Gly ser Gly He Gly Gly Leu val Ala 
100 105 

Ala Thr Gin Leu Ala val Lys Gly Ala Lys Val Leu Val Leu Glu Lys 
115 120 A " 

Tyr val lie Pro Gly Gly ser ser Gly Phe Tyr Glu Arg Asp Gly Tyr 
130 135 

Lys Phe Asp val Gly ser ser Val Met Phe Gly Phe ser Asp Lys Gly 
145 150 !.>-> 
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1728 



1776 



1824 



1848 



04sequ.txt 



Asn Leu Asn 



Leu lie Thr Gin Ala Leu Ala Ala Val Gly Arg Ly| Leu 



165 



170 



Glu val He Pro Asp Pro Thr Thr Val His Phe His Leu Pro Asn Asp 
180 18 j 

. Leu ser val Arg lie His Arg Glu Tyr Asp Asp Phe lie Glu Glu Leu 

val ser Lys Phe Pro His Glu Lys Glu Gly He lie Lys Phe Tyr Ser 
210 215 z 

Glu cys Trp Lys lie Phe Asn ser Leu Asn ser Leu Glu Leu Lys ser 



225 



230 



eu Glu Glu Pro lie Tyr Leu Phe Gly Gin Phe Phe Lys Lys Pro Leu 
245 250 

ITu cys Leu Thr Leu Ala Tyr Tyr Leu Pro Gin Asn Ala Gly ser He 



260 



Ala Arg Lys Tyr lie Arg Asp Pro Gly Leu Leu Ser Phe He Asp Ala 

Glu cys Phe lie Val ser Thr val Asn Ala Leu Gin Thr Pro Met lie 
290 295 3UU 

Asn Ala ser Met val Leu Cys Asp Arg His Phe Gly Gly He Asn Tyr 
305 310 315 

Pro val Gly Gly val Gly Glu lie Ala Lys Ser Leu Ala Lys Gl^ Leu 




p Asp His Gly Ser Gin lie Leu Tyr Arg Ala Asn Val Thr ser He 
340 345 3:>u 

He Leu Asp Asn Gly Lys Ala val Gly val Lys Leu ser Asp Gly Arg 



355 



360 



Lys Phe Tyr Ala Lys Thr lie val Ser Asn Ala Thr Arg Trp Asp Thr 



370 



375 



Phe 



Gly Lys Leu Leu Lys Ala Glu Asn Leu Pro Lys Glu Glu Glu Asn 
385 390 395 *uu 

Phe Gin Lys Ala Tyr Val Lys Ala Pro ser Phe Leu ser lie His Met 
405 410 ^J-* 

Gly Val Lys Ala Asp val Leu Pro Pro Asp Thr Asp cys His His Phe 



420 
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Val Leu Glu Asp Asp Trp Thr Asn Leu Glu Lys Pro Tyr Gly ser He 
435 440 

Phe Leu ser He Pro Thr val Leu Asp ser ser Leu Ala Pro Glu Gly 
450 4 " 

His His He Leu His lie Phe Thr Thr ser ser He Glu Asp Trp Glu 
465 470 

Gly L eu ser Pro Lys Asp Tyr Glu Ala L^s Lys Glu val Val Ala Glu 

A rg lie He Ser Arg Leu Glu Lys Thr Leu Phe Pro Gly Leu Lys Ser 
500 -> u:) 



ser He Leu Phe Lys Glu Val Glj Thr Pro Lys Thr His Arg Arg Tyr 



515 



Su Ala Arg Asp ser Gly Thr Tyr Gly Pro Met Pro Arg Gly Thr Pro 
530 535 

Lys Gly Leu Leu Gly Met Pro Phe Asn Thr Thr Ala He Asp Gly Leu 




545 

Tyr cys Val Gly Asp ser cys Phe Pro Gly Gin Gly Val lie Ala Val 

Ala Phe ser Gly Val Met cys Ala His Arg Val Ala Ala A|g Leu Gly 
580 

Phe Glu Lys Lys ser Asp Val Leu Asp Ser Ala Leu Leu Arg Leu Leu 
595 600 

y Trp Leu Arg Thr Leu Ala 
y 610 615 

<210> 77 
<211> 1233 
<212> DNA 

<213> Tagetes erecta 
<220> 

<221> CDS 

<222> CD - • C1233) 

<223> 
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<400> 77 

atg gcc aca cac aaa etc ctt caa ttc acc acc aat etc cca cca tct 48 
Met Ala Thr His Lys Leu Leu Gin Phe Thr Thr Asn Leu Pro Pro ser 
1 5 10 15 

tct tct tea ate tct act ggc tgt tea etc tec ccc ttc ttc etc aaa 96 
ser Ser ser lie ser Thr Gly cys ser Leu ser Pro Phe Phe Leu Lys 
20 25 30 

tea tct tct cat tec cct aac cct cgc cga cac cgc cgc tec gcc gta 144 
Ser ser Ser His Ser Pro Asn Pro Arg Arg His Arg Arg Ser Ala Val 
35 40 45 



tgc tgc tct ttc gcc tea etc gac tct gca aaa ate aaa gtc gtt ggc 

Cys cys ser Phe Ala Ser Leu Asp Ser Ala Lys lie Lys Val Val Gly 
50 55 60 

gtc ggt ggt ggt ggc aac aat gcc gtt aac cgc atg att ggt age ggc 

val Gly Gly Gly Gly Asn Asn Ala Val Asn Arg Met lie Gly ser Gly 

65 70 75 80 



• 



cag ggt gtt gat ttt tac gcc att aac acg gac tea caa gcg ctt 
Gin Gly val Asp Phe Tyr Ala lie Asn Thr Asp ser Gin Ala Leu 
85 90 95 




t gta acg tac cca ttc age ttt gaa ggc cgt aaa aga tea gta cag 
.1 val Thr Tyr Pro Phe ser Phe Glu Gly Arg Lys Arg ser Val Gin 
180 185 ~ 190 



caa gga ate tea gat ata att aca ata cct ggg ctg gta aat gtg gac 
Gin Gly lie ser Asp lie lie Thr lie Pro Gly Leu Val Asn Val Asp 



192 



240 



288 



336 



384 



ctg caa tct gtt gca cat aac cct att caa att gqg gag ctt ttg act 
Leu Gin ser val Ala His Asn Pro lie Gin lie Gly Glu Leu Leu Thr 
100 105 110 

cgt gga tta ggt act ggt ggg aac ccg ctt ttg gga gaa cag get gcg 
Arg Gly Leu Gly Thr Gly Gly Asn Pro Leu Leu Gly Glu Gin Ala Ala 
115 120 125 

gag gag teg aag gaa gcg att ggg aat gcg ctt aaa ggg teg gat ctt 432 
Glu Glu Ser Lys Glu Ala lie Gly Asn Ala Leu Lys Gly ser Asp Leu 
130 135 140 

gtg ttt ata aca gca ggt atg ggt ggt ggg acg ggt teg ggt get get 480 
val Phe lie Thr Ala Gly Met Gly Gly Gly Thr Gly ser Gly Ala Ala 
145 150 155 160 

cca gtt gta gcg cag ata gcg aaa gaa gca ggg tat tta act gtt ggt 528 
Pro val Val Ala Gin lie Ala Lys Glu Ala Gly Tyr Leu Thr Val Gly 
165 170 175 



576 



gcg tta gag get att gag aag ctg caa aag aac gtt gac aca ctt ata 624 
Ala Leu Glu Ala lie Glu Lys Leu Gin Lys Asn Val Asp Thr Leu He 
195 200 205 

gtg att cca aat gac cgt ttg ctg gat att get gat gaa aac acg cct 672 
val lie Pro Asn Asp Arg Leu Leu Asp lie Ala Asp Glu Asn Thr Pro 
210 215 220 

ctt cag gat get ttt ctt ctt get gat gat gta etc cgc caa gga gtt 720 
Leu Gin Asp Ala Phe Leu Leu Ala Asp Asp Val Leu Arg Gin Gly val 
225 230 235 240 



768 



ttt gca gac gtt aaa gca gtc atg aaa gat tct gga act gca atg ctt 816 
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Phe Ala Asp val Lys Ala Val Met Lys Asp ser Gly Thr Ala Met Leu 
260 265 270 

ggt gtc ggt gtt tec tea agt aaa aac cga get gaa gaa gca get gaa 
gTv val Gly val Ser Ser Ser Lys Asn Arg Ala Glu Glu Ala Ala Glu 
275 280 285 

caa gca act ctt get cct ttg att gga tea tea att caa tct get aca 
Gin Ala Thr Leu Ala Pro Leu lie Gly Ser ser lie Gin ser Ala Thr 
290 295 300 

ggt gtt gtt tat aat att ace gga ggg aag gac ata act eta caa gaa 
Gly val val Tyr Asn lie Thr Gly Gly Lys Asp lie Thr Leu Gin Glu 
305 310 315 320 

gtc aac agg gtt tct cag gtg gta aca agt ttg gca gat cca tea gca 
val Asn Arg Val ser Gin Val val Thr ser Leu Ala Asp Pro ser Ala 
325 330 335 

aac att ata ttc ggg gca gtg gta gat gag aga tac aac ggg gag att 
Asn lie lie Phe Gly Ala Val Val Asp Glu Arg Tyr Asn Gly Glu lie 
340 345 350 

X gtg ace att gtt get act gqc ttt gee cag teg ttt cag aaa tct 
k val Thr lie Val Ala Thr Gly Phe Ala Gin Ser Phe Gin Lys ser 
355 360 365 




get ccg tct egg tct agg aaa etc ttc ttt taa 
Ala Pro Ser Arg Ser Arg Lys Leu Phe Phe 
405 410 

<210> 78 
<211> 410 
<212> PRT 

13> Tagetes erecta 

<400> 78 

Met Ala Thr His Lys Leu Leu Gin Phe Thr Thr Asn Leu Pro Pro ser 
1 5 10 15 

Ser Ser Ser lie Ser Thr Gly Cys Ser Leu Ser Pro Phe Phe Leu Lys 
20 25 30 

Ser Ser Ser His Ser Pro Asn Pro Arg Arg His Arg Arg Ser Ala val 
35 40 45 

cys Cys Ser Phe Ala Ser Leu Asp Ser Ala Lys lie Lys Val Val Gly 
50 55 60 
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864 



912 



960 



1008 



1056 



1104 



1152 



ctt ctt get gac ccg aaa gga gca aaa ctt gtt gat aga aat caa gaa 
Leu Leu Ala Asp Pro Lys Gly Ala Lys Leu Val Asp Arg Asn Gin Glu 
370 375 380 

cct aca caa cct ttg act tec gcg aga tct ttg aca aca cct tct cct 1200 
Pro Thr Gin Pro Leu Thr ser Ala Arg ser Leu Thr Thr Pro ser Pro 
385 390 395 400 



1233 



04sequ.txt 

val Gly Gly Gly Gly Asn Asn Ala val Asn Arg Met He Gly sen Gly 
65 70 



Leu 



Gin Gly val Asp Phe Tyr Ala He Asn Thr Asp ser Gin Ala Leu 



85 



Leu Gin ser Val Ala His Asn Pro lie Gin He Gly Glu Leu Leu Thr 

Arg Gly Leu Gly Thr Gly Gly Asn Pro Leu Leu Gly Glu Gin Ala Ala 

Glu Glu ser Lys Glu Ala lie Gly Asn Ala Leu Lys Gly ser Asp Leu 
130 135 

val Phe He Thr Ala Gly Met Gly Gly Gly Thr Gly ser Gly Ala Al 



a 

160 



145 150 

Val val Ala Gin He Ala Lys Glu Ala Gly Tyr Leu Thr val Gly 
165 170 

val Val Thr Tyr Pro Phe ser Phe Glu Gly Arg Lys Arg Ser val Gin 




180 



185 




Ala Leu Glu Ala He Glu Lys Leu Gin Lys Asn Val Asp Thr Leu He 
195 200 ^ D 

val He Pro Asn Asp Arg Leu Leu Asp He Ala Asp Glu Asn Thr Pro 
210 215 

Leu Gin Asp Ala Phe Leu Leu Ala Asp Asp val Leu Arg Gin Gly val 
225 230 

Gin Gly He ser Asp He He Thr He Pro Gly Leu val Asn val Asp 
Ala Asp val Lys Ala val Met v.ys Asp ser Gly Thr Ala Met Leu 



260 



265 



Gly val Gly val ser ser ser Lg Asn Arg Ala Glu Glu Ala Ala Glu 

Gin Ala Thr Leu Ala Pro Leu He Gly ser Ser lie Gin ser Ala Thr 
290 295 

Gly val val Tyr Asn He Thr Gly Gly Lys Asp He Thr Leu Gin Glu 



305 



310 



val Asn Arg val ser Gin Val val Thr ser Leu Ala Asp Pro ser Ala 



325 
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ash He lie Phe Gly Ala val val Asp Glu Arg Tyr ash Gl ? Glu He 



His val Thr ^ e ^ Ala Thr ffi! 365 ^ 

Asp 

370 375 380 



355 360 
Leu Leu Ala Asp Pro Lys Gly Ala Lys Leu val Asp Arg Asn Gin Glu 



Pro Thr Gin Pro Leu Thr ser Ala Arg ser Leu Thr Thr Pro ser Pro 
385 

Ala Pro ser Arg Ser Arg Lys Leu Phe Phe 



<210> 79 

<211> 33 

2> DNA 

13> Kunstliche sequenz 



<2i: 



<220> 

<221> primer_bind 
<222> (1) ■ • C33) 
<223> 



gcatgctcta gaccttataa agatattttg tga 



<210> 80 

11> 33 

12> DNA 

<213> Kunstliche sequenz 

<220> 

<221> primer_bind 

<222> CD • - C33) 
<223> 



gStgcatct agaaatggtt cagtgtcaac cat 




seite 125 



04sequ . txt 

<210> 81 
<211> 805 
<212> DNA 

<213> Nostoc sp. Strain PCC7120 . 



<220> 

<221> vari ati on 
<222> CD - • C805) 
<223> 



SSScatrt agaaatggtt cagtgtcaac catcatctct gcattcagaa aaactggtgt 

•ttgtcatc gacaatcaga gatgataaaa atattaataa gggtatattt attgcctgct 
Lcttatt tttatgggca attagtttaa tcttattact ctcaatagat acatccataa 
ttcataagag cttattaggt atagccatgc tttggcagac cttcttatat acaggtttat 
ttattactgc tcatgatgcc atgcacggcg tagtttatcc caaaaatccc agaataaata 
attttatagg taagctcact ctaatcttgt atggactact cccttataaa gatttattga 
aaaaacattg gttacaccac ggacatcctg gtactgattt agaccctgat tattacaatg 
gtcatcccca aaacttcirtt ctttggtatc tacattttat gaagtcttat tggcgatgga 
cgcaaatttt cggattagtg atgatttttc atggacttaa aaatctggtg catataccag 
aaaataattt aattatattt tggatgatac cttctatttt aagttcagta caactatttt 
attttggtac atttttgcct cataaaaagc tagaaggtgg ttatactaac ccccattgtg 
cgcgcagtat cccattacct ctt«ttggt cttttgttac ttgttatcac ttcggctacc 
_acaaggaaca tcacgaatac cctcaacttc cttggtggaa attacctgaa gctcacaaaa 
ktctttata aggtctagag catgc 




<210> 82 

<211> 37 

<212> DNA 

<213> Kunstliche sequenz 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
805 



<220> 

<221> Primer 
<222> CD--C37) 
<223> 
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SS^tgSt ctagaaatga tccagttaga acaacca 37 

<210> 83 

<211> 37 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<221> Primer 
<222> CD • ■ C37) 
<223> 

I 

glgStgSc tagactattt tgctttgtaa atttctg 

<210> 84 

<211> 792 

<212> DNA 

<213> Nostoc puncti forme ATCC 29133 



<220> 

<221> misc_feature 
<222> C5) ■ • C775) 
23> 

tS£*£* ctagaaatga tccagttaga acaaccactc agtcatcaag caaaactgac 60 
tccagtactg agaagtaaat ctcagtttaa ggggcttttc attgctattg tcattgttag 120 
cgcatgggtc attagcctga gtttattact ttcccttgac atctcaaagc taaaattttg 180 
gatgttattg cctgttatac tatggcaaac atttttatat acgggattat ttattacatc 240 
tcatgatgcc atgcatggcg tagtatttcc ccaaaacacc aagattaatc atttgattgg 300 
aacattgacc ctatcccttt atggtctttt accatatcaa aaactattga aaaaacattg 
gttacaccac cacaatccag caagctcaat agacccggat tttcacaatg gtaaacacca 420 
aagtttcttt gcttggtatt ttcattttat gaaaggttac tggagttggg ggcaaataat 480 
tgcgttgact attatttata actttgctaa atacatactc catatcccaa gtgataatct 540 
y * * seite 127 
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aacttacttt tgggtgctac cctcgctttt aagttcatta caattattct attttggtac 600 

ttttttaccc catagtgaac caataggggg ttatgttcag cctcattgtg cccaaacaat 660 

tagccgtcct atttggtggt catttatcac gtgctatcat tttggctacc acgaggaaca 720 

tcacgaatat cctcatattt cttggtggca gttaccagaa atttacaaag caaaatagtc 780 

tagagcatgc gc 792 

<210> 85 

<211> 26 

<212> DNA 

<213> Kunstliche Sequenz 



;£220> 

1> Primer 
<222> (1) . . (26) 
<223> 



<400> 85 

gtcgaccctg ctttaatgag atatgc 26 

<210> 86 

<211> 27 

<212> DNA 

<213> Kunstliche sequenz 



«20> 

21> Primer 

<222> (1) . . (27) 
<223> 

<400> 86 

ctcgagcttg gacaatcagt aaattga 

<210> 87 

<211> 210 

<212> DNA 

<213> Agrobacterium tumefaciens 
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<220> 

<221> Terminator 
<222> (1)..(210) 
<223> 



tS&J** ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa 60 
ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt 120 
tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc 
cgttcaattt actgattgtc caagctcgag 



<210> 88 

1> 1773 

5212> DNA 

<213> Petunia hybrida 



<2K 

m 



180 
210 



<220> 

<221> Promotor 
<222> CD • • C1773) 
<223> 




Sag?tctlgc gcaatcttat gtggtacaaa tcttgattag tcgggaaaaa atgatgtggc 
cctacaaatg gttggaggat gggagatttg gctctatcta gagttatgtg gttgttgaag 

||tttggtta ctctctgctg tggtagttgg catatccaca ttgtctcctt ccacttttat 
SLattacg tgaaagttat gggttgtttt gtctattttt gtcgaggcct ttcttttcct 
tccaggttgt tgaagatggt ccaattcgat tagaataatg ttttgagctt tagcatattc 
tctctcgttt acacgattat agtaataatg atataggatg acagaagttg acacataaat 
tttttattct ctccatttac tttaatccaa atctcaccta ccctaaactt ctttaatatg 
tattcaatag tctatccgag taaattgtaa atttaacaac cattgataat attgacacct 
actaacatat actagtaaag agaatattaa catggcacat ataatttgat gcaaaatgag 
tatgatgaaa tttaaaccca aaatctcttg attttgacag tgtcaccttg acttgttaac 
taataagtca tgttttagtg gcagaaagac aaactcatcc accaactgta tagcaataaa 
aaatagaaga atcttcctga ggcaaagttt tggaaaaatt aagagtggct gagatttaat 
ttcaacagga attagttcca cttaactttt aggttacgat acagtgctaa ttaaataact 



300 

360 

420 

480 

540 

600 

660 

720 

780 
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taattgtatt agatatttct tgcacctaaa aaatttaaaa actgaaaaaa ggtagcaatc 840 

aaaataaaca aaaggacaaa ataagtgaaa ggtacagcca ccaaccctgg cggctcactg 900 

tttgttggtt aaaacgtaga cttacaccta ccaaaatcta caactaaaat gaggcaataa 960 

tactttgccc aaaattacca agaaaagaaa aagaaaggaa tcccttaata ttactctcct 1020 

ccatttcaca ataaatatcc tagtttgact taaattagag tttaaaaaat gaaagacgac 1080 

ttttaaaact tgtaatctaa aataaatcat agttaaatgt gtggctataa atcattgtat 1140 

taacggtaaa gtggtaagtt taaaagttaa ttgttttcaa atataaaatt gtactatcat 1200 

tctttttgga atggactaat aagaaaacta tgacatccat tatggagcgg agggagtatc 1260 

tccttttaac aataaccttt gtcccttcaa ttcaattatc agtatgcaaa cattaaaaat 1320 

tattattgat gttaagtacc acatcatcct taatgataga atcatcgtag aacgcttttc 1380 

caggcacaca ttcaaactag ttagaccagt accacacatc gaatattcca gacttctttg 1440 

fgaatagt cgactacatt ggataatgga acttctcgaa ttaacttcga attagtcgag 1500 

taaaataa tatatacgtc gggtggaaaa ctataaaatg tttgacaaaa atgtcaaatt 1560 

aatatatcaa tctgcaacaa ccttttcacc ttgagaacac agctgaaatt ttttacaaag 1620 

gtagttggtg aagctagtca gcgaatccca ttaccttcca ctctacctaa cccccttcac 1680 

caacaacaaa tttctgtaat ttaaaaacta gccaaaaaag aactctcttt tacaaagagc 1740 

caaagactca atctttactt tcaagaaaag ctt 1773 

<210> 89 

<211> 29 

<212> DNA 

<213> Kunstliche Sequenz 
20> 

21> Primer 

<222> (1) - . (29) 
<223> 

<400> 89 

gagctctagc gcaatcttat gtggtacaa . 29 

<210> 90 

<211> 29 

<212> DNA 

<213> Kunstliche sequenz 
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<220> 

<221> Primer 
<222> (1) . • (29) 
<223> 



<400> 90 

aagcttttct tgaaagtaaa gattgagtc 

<210> 91 

<213> 39 

<212> DNA 

<213> Kiinstliche sequenz 



^220> 
<221> Primer 
<222> CD - - (39) 
<223> 




<400> 91 

gcgcatgcat ctagaaatga atttttgtga taaaccagt 

<210> 92 

<211> 37 

<212> DNA 

^^^pl3> Kunstliche sequenz 

<220> 

<221> Primer 

<222> (1) . . (37) 
<223> 



<400> 92 

gcgcatgctc tagattacga attggttact gaattgt 



<210> 93 
<211> 819 
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<212> DNA 

<213> Nostoc puncti forme ATCC 29133 
<220> 

<221> misc_feature 

<222> (5).. (802) 
<223> 

<400> 93 

gcgcatgcat ctagaaatga atttttgtga taaaccagtt agctattatg ttgcaataga 60 

gcaattaagt gctaaagaag atactgtttg ggggctggtg attgtcatag taattattag .120 

tctttgggta gctagtttgg cttttttact agctattaat tatgccaaag tcccaatttg 180 

•tgatacct attgcaatag tttggcaaat gttcctttat acagggctat ttattactgc 240 

ktgatgct atgcatgggt cagtttatcg taaaaatccc aaaattaata attttatcgg 300 

ttcactagct gtagcgcttt acgctgtgtt tccatatcaa cagatgttaa agaatcattg 360 

cttacatcat cgtcatcctg ctagcgaagt tgacccagat tttcatgatg gtaagagaac 420 

aaacgctatt ttctggtatc tccatttcat gatagaatac tccagttggc aacagttaat 480 

agtactaact atcctattta atttagctaa atacgttttg cacatccatc aaataaatct 540 

catcttattt tggagtattc ctccaatttt aagttccatt caactgtttt atttcggaac 600 

atttttgcct catcgagaac ccaagaaagg atatgtttat ccccattgca gccaaacaat 660 

aaaattgcca acttttttgt catttatcgc ttgctaccac tttggttatc atgaagaaca 720 

tcatgagtat ccccatgtac cttggtggca acttccatct gtatataagc agagagtatt 780 

caacaattca gtaaccaatt cgtaatctag agcatgcgc 819 

•10> 94 

11> 33 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<221> Primer 

<222> (1) . . (33) 
<223> 



<400> 94 

gcgcatgcat ctagaaatgg cgatcgccat tat 

Seite 132 



33 
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<210> 95 

<211> 32 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<221> Primer 



<222> CD • ■ C32) 
<223> 

<400> 95 _ na 32 



1 



Icatgctc tagatcacaa atttgattta ga 



10> 96 
<211> 720 
<212> DNA 

<213> Nodularia spumigena NSORlO 
<220> 

<221> CDS 

<222> (5) . . (703) 

<223> . 



g a 70 
ctt tta cct tat caa aaa ctt tta aaa aag cat tog eta cat cac cat 

Seite 133 



49 
97 



*sFsb a s!s a m as hs a a is sb a ie a 
it; as «5 a a a a a as f - as a 5? a a 
s a a a a sr. a as $ * a a a f « a 145 
^ as a a ss a a sa a w «a «s a ss a a 

50 55 

a a ss ss a a ss a a a a a a a a? 



241 
289 



Leu Leu Pro Tyr Gin Lys Leu Leu Lys Lys His Trp Leu His His His 
80 85 

£ a HS IS ffi S? SS SS B5 jgj SIS SS I?? 3! 1 5! 

as s s m 3 $ 3 a a a a a - 1 * a 
s s n „ a a a a a? a a a ss a a a a a 

130 " b 

a a ss a ss as a a a a a, ss «a ss a 

145 150 

sr. a a a a a a a a a p o a a a ss as 
j ss p" ?s fu B5 a a a 9 , a a a a a a a 
is a ss a a a a a a a a a a a a a 




225 




<210> 97 

<211> 233 

<212> PRT 

13> Nodularia spumigena NSORlO 



<400> 97 

Met His Leu Glu Met Ala He Ala He lie. ser He Trp Ala lie ser 
Leu Gly Leu Leu Leu Tyr He Asp lie Ser Gin Phe Lys Phe Trp Met 



20 



Leu Leu Pro Leu He Phe Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe 



35 



40 



337 
385 
433 
481 
529 
577 
625 
673 
720 



He Thr AT His Asp Ala Met His G!y val val Phe Pro Lys Asn Pro 
50 55 
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Lys lie Asn His Phe lie Gly Ser Leu cys Leu Phe Leu Tyr Gly Leu 
65 70 75 80 

Leu Pro Tyr Gin Lys Leu Leu Lys Lys His Trp Leu His His His Asn 
85 90 95 

Pro Ala Ser Glu Thr Asp Pro Asp Phe His Asn Gly Lys Gin Lys Asn 
100 105 110 

Phe Phe Ala Trp Tyr Leu Tyr Phe Met Lys Arg Tyr Trp ser Trp Leu 
115 120 125 

Gin lie lie Thr Leu Met lie lie Tyr Asn Leu Leu Lys Tyr lie Trp 
130 135 140 



His Phe Pro Glu Asp Asn Met Thr Tyr Phe Trp val val Pro Ser lie 
145 150 " 155 160 



Ser Ser Leu Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His ser 
165 170 175 



Glu Pro val Glu Gly Tyr Lys Glu Pro His Arg Ser Gin Thr lie Ser 
180 185 190 

Arg Pro lie Trp Trp Ser Phe He Thr Cys Tyr His Phe Gly Tyr His 
195 200 205 

Tyr Glu His His Glu Tyr Pro His val Pro Trp Trp Gin Leu Pro Glu 
210 215 220 



lie Tyr Lys Met ser Lys ser Asn Leu 
225 230 
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Promotoren zur Expression von Genen in Tagetes 
Zusammenfassung 

Die vorliegende Erfindung betrifft die Verwendung von Promotoren zur Expression, 
vorzugsweise zur blQtenspezifischen Expression von Genen in Pflanzen der Gattung 
Tagetes, die genetisch verSnderten Pflanzen der Gattung Tagetes sowie ein Verfahren 
zur Herstellung von biosynthetischen Produkten durch Kultivierung der genetisch ver- 
anderten Pflanzen. 
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